توضیحات
آموزش پیاده سازی OCR برای کاربردهای مختلف
نام دوره : Optical Character Recognition (OCR) in Python
پیش نیاز:
- منطق برنامه نویسی
- دانش پایه برنامه نویسی پایتون
توضیحات:
در حوزه بیانیی کامپیوتر، زیر ناحیه تشخیص کاراکتر نوری (OCR) قرار دارد که هدف آن تبدیل تصاویر به متن است.
OCR را می توان به عنوان تبدیل تصاویر حاوی متن تایپ شده، دست نویس یا چاپ شده به کاراکترهایی که ماشین می تواند درک کند، توصیف کرد.
امکان تبدیل اسناد اسکن شده یا عکس گرفته شده به متون قابل ویرایش در هر ابزاری مانند Microsoft Word وجود دارد.
یک برنامه رایج، خواندن خودکار فرم است که در آن می توانید عکس کارت اعتباری یا گواهینامه رانندگی خود را ارسال کنید و سیستم می تواند تمام داده های شما را بدون نیاز به تایپ دستی بخواند.
یک خودروی خودران می تواند از OCR برای خواندن علائم راهنمایی و رانندگی استفاده کند و یک پارکینگ می تواند با خواندن پلاک خودروها دسترسی را تضمین کند!
برای اینکه شما را به این حوزه ببریم، در این دوره به صورت عملی یاد می گیرید که چگونه از کتابخانه های OCR برای تشخیص متن در تصاویر و ویدئوها استفاده کنید، تمام کدهای پیاده سازی شده گام به گام با استفاده از زبان برنامه نویسی پایتون!
ما قصد داریم از Google Colab استفاده کنیم، بنابراین لازم نیست نگران نصب کتابخانه ها بر روی دستگاه خود باشید، زیرا همه چیز به صورت آنلاین با استفاده از GPU های Google توسعه می یابد!
همچنین یاد خواهید گرفت که چگونه با استفاده از یادگیری عمیق و شبکه های عصبی کانولوشنال OCR خود را از ابتدا بسازید!
در زیر می توانید سرفصل های اصلی دوره آموزش پیاده سازی OCR برای کاربردهای مختلف را بررسی کنید:
- تشخیص متون در تصاویر و ویدئوها با استفاده از Tesseract، EasyOCR و EAST
- عبارات خاص را در تصاویر با استفاده از عبارات منظم جستجو کنید
- تکنیک هایی برای بهبود کیفیت تصویر مانند: آستانه گذاری، وارونگی رنگ، مقیاس خاکستری، تغییر اندازه، حذف نویز، عملیات مورفولوژیکی و تبدیل پرسپکتیو
- معماری EAST و کتابخانه EasyOCR برای عملکرد بهتر در صحنه های طبیعی
- آموزش OCR از ابتدا با استفاده از TensorFlow و تکنیک های مدرن یادگیری عمیق، مانند شبکه های عصبی کانولوشنال
- کاربرد تکنیکهای پردازش زبان طبیعی در متون استخراجشده توسط OCR (کلمات ابری و شناسایی موجودیت نامدار)
- پلاک خوانی
اینها تنها بخشی از موضوعات اصلی هستند! در پایان دوره، همه چیزهایی را که برای ایجاد پروژه های تشخیص متن خود با استفاده از OCR نیاز دارید، خواهید دانست!
دوره آموزش پیاده سازی OCR برای کاربردهای مختلف برای چه کسانی است:
- هر کسی که به OCR (تشخیص کاراکتر نوری) علاقه دارد
- دانشجویان کارشناسی که در حال مطالعه موضوعات مرتبط با هوش مصنوعی، پردازش تصویر دیجیتال یا بینایی کامپیوتری هستند.
- دانشمندان داده ای که می خواهند دانش خود را در کامپیوتر ویژن افزایش دهند
- افراد حرفه ای علاقه مند به توسعه راه حل های حرفه ای تشخیص کاراکتر نوری
- افرادی که علاقه مند به ایجاد OCR سفارشی خود هستند
یودمی ایران –
دوره درخواستی خود را از راه های ارتباطی درخواست کنید