ارایه روشی جهت جداسازی زیر کلمات در اسناد تایپی فارسی به کمک پردازش تصویر و ویژگی های آماری


در حال بارگذاری
11 سپتامبر 2024
فایل ورد و پاورپوینت
2120
12 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

 ارایه روشی جهت جداسازی زیر کلمات در اسناد تایپی فارسی به کمک پردازش تصویر و ویژگی های آماری دارای ۱۶ صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد ارایه روشی جهت جداسازی زیر کلمات در اسناد تایپی فارسی به کمک پردازش تصویر و ویژگی های آماری  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی ارایه روشی جهت جداسازی زیر کلمات در اسناد تایپی فارسی به کمک پردازش تصویر و ویژگی های آماری،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن ارایه روشی جهت جداسازی زیر کلمات در اسناد تایپی فارسی به کمک پردازش تصویر و ویژگی های آماری :

تعداد صفحات :۱۶

چکیده مقاله:

هدف این مقاله ارایه روش جهت جداسازی زیرکلمات با استفاده از ویژگی های آماری استخراج شده از اسناد تایپیفارسی میباشد. جداسازی زیرکلمات در یک سند یکی از مهمترین مراحل پیشپردازش، جهت آنالیز مکانیابی و بازشناسیکلمات در یک سند است. کلمات فارسی برخلاف کلمات انگلیسی از زیرکلمات تشکیل شدهاند. با جستجوی زیرکلمات میتوانبا استفاده از ویژگیهای استخراج شده آنها کلمه مورد نظر را در صورت اینکه در سند موجود باشد مکانیابی نمود. اینبررسی پس از جداسازی خطوط و زیرکلمات در سند با استفاده از ویژگی های آماری و ساختاری آنها به ایجاد الگو برای تکتک زیرکلمات و ذخیرهسازی در یک آرایه به عنوان پایگاه داده میپردازد. با فرض بر اینکه اسناد موجود برای جداسازیخطوط، باینری میباشد و خطوط موجود در اسناد در آرایه ای از ماتریس ها به صورت جداگانه در اندیس های آرایه ای ذخیرهشده است. در ابتدا برای تک تک خطوط جدا شده در اسناد مورد نظر الگوریتم نوشته شده اجرا می گردد و با تشخیص وجداسازی زیرکلمات آنها را در ماتریس های جداگانه برای استفاده ذخیره می نماید. در این روش با استفاده از مقادیر بدستآمده از ویژگی های آماری ماتریس خطوط، با در نظر گرفتن پیوستگی ستونی زیرکلمات جدا سازی آنها انجام می شود. نتایجبدست آمده از بررسی روش بکاربرده شده برای ۵۵ سند تایپی با فونت های متداول و اندازه های مختلف نشان می دهد کهجداسازی تقریبا برای ۹۹ % زیرکلمات در این اسناد، با فونت های رایج Nazanin, BNazanin, Zar, BZar, Mitra, Lotus, Blotus و همچنین فونت های مشابه با موفقیت انجام می پذیرد.

  راهنمای خرید:
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.