جستجو در سایت

تماس با ما: 09361509687  ایمیل: royalproje.ir[ at ]gmail.com

Get Started

روش های موجود برای شناسایی متن در تصاویر می توانند به دو گروه روش های پائین به بالا و روش های بالا به پائین تقسیم شوند. روشهای پائین به بالا تصاویر را به ناحیه هایی تقسیم میکنند و سپس ناحیه های کاراکتر را به کلمات گروه بندی می کنند. کارایی تشخیص این روش ها به الگوریتم بخش بندی و پیچیدگی محتوای تصویر بستگی دارد. الگوریتم های بالا به پائین در ابتدا ناحیه های تصویر را شناسایی می کنند و سپس هر کدام از آنها را به ناحیه های متن و زمینه بخش بندی می کنند. این روش ها قادرند تصاویر پیچیده تری را نسبت به روش-های پائین به بالا پردازش کنند اما با این وجود مشکلات مراحل شناسایی و بخش بندی/تشخیص در هر دو روش وجود دارد.
اگرچه روش های زیادی برای شناسایی متن ارائه شده است، الگوریتم های سریع و مقاوم برای شناسایی متن تحت شرایط مختلف کم می باشد. توسعه یک الگوریتم شناسایی متن مقاوم و سریع کار مشکلی می باشد. مشکلات این کار عبارتند از:
1) متن معمولا در زمینه پیچیده پنهان است.
2) پیدا کردن ویژگی های موثر برای تشخیص متن، با چیزهای شبیه متن مثل برگ ها ، پنجره ها یا بافت های عمومی مشکل می شود.
3) الگو متن با اندازه فونت، رنگ فونت و زبان تغییر می کند.
4) کیفیت متن بر اثر نویز و فرایند رمزگشایی/رمزنگاری تصویر کاهش می یابد.
روش‌هاي متعددي براي استخراج اطلاعات متن (TIE) از تصوير و ويدئو براي کاربردهايي چون تقطيع صفحه ، آدرس پستي ، پلاک خوان اتومبيل و نمايه‌سازي محتوايي تصوير و ويدئو ارائه گرديده است. اما علي‌رغم مطالعات گسترده در اين زمينه، طراحي سيستمي جامع براي تمام کاربردها کار بسيار دشواري است. زيرا منابع تغييرات گسترده‌اي در استخراج متن وجود دارد که از جمله آنها عبارتند از: سايه و بافت پس‌زمينه، کنتراست پايين تصوير، تصاوير پيچيده و تغييرات گسترده در اندازه، نوع، رنگ، جهت و صف‌بندي. اين تغييرات مانع از ايجاد سيستم جامعي براي استخراج خودکار اطلاعات تصوير مي‌شود.

2خصوصیات متن
متن در تصاویر ممکن است خصوصیات متفاوتی داشته باشند که در اینجا این خصوصیات ذکر می شوند:
• اندازه: اگرچه اندازه متن می تواند متغیر باشد اما می توان فرض هایی بر حسب نوع کاربرد برنامه در مورد آن اعمال نمود.
• همترازی : متن های زیرنویس در دسته های متفاوتی دیده می شوند و معمولا به صورت افقی قرار می-گیرند، اگر چه بعضی مواقع می توانند به عنوان متن های غیر هم سطح به عنوان جلوه های ویژه در نظر گرفته شوند. این مسئله در مورد متن های منظره که اعوجاج های دید مختلف دارند صدق نمی کند. متن های منظره می توانند در هر جهتی همتراز شوند و انحراف های هندسی دارند.
• فاصله بین کاراکتری: کاراکترها در خطوط متن فاصله های یکسانی دارند.
• رنگ: کاراکترها معمولا رنگ های یکسان یا مشابه دارند. این خصوصیت باعث می شود تا استفاده از روش اجزاء متصل همبند فراهم شود. بیشتر کارهای انجام شده بر روی پیدا نمودن متن های تک رنگه استوار بوده اند. اگرچه ویدئوهای تصویری و سندهای رنگی پیچیده ای وجود دارند که از چندین رنگ استفاده نموده اند.
• حرکت: کاراکترهای مشخص معمولا در فریم های متوالی در ویدئو ثابت یا متحرک هستند. این خصوصیت در ردیابی متن و بهبود آن استفاده می شود. متن عنوان معمولا به صورت مشخص افقی یا عمودی حرکت می کند. متن صحنه ممکن است حرکت دلخواهی داشته باشد.
• لبه: بیشتر متن های عنوان و صحنه طوری طراحی شده اند که به آسانی قابل خواندن باشند. بنابراین این متن ها لبه های قوی دارند.
• فشرده سازی: بسیاری از تصاویر دیجیتال به صورت فشرده ضبط، پردازش و منتقل می شوند. بنابراین یک سیستم سریع TIE که بتواند متن ها را استخراج کند لازم می باشد.

اشتراک برای
آپ دیت ودریافت خبرها