تکنولوژی تشخیص متن یا به اختصار OCR برای شناسایی حروف و تبدیل متن یا حتی دست‌خط به متن قابل ویرایش کاربرد دارد. گوگل درایو در حال حاضر OCR زبان فارسی را هم پشتیبانی می‌کند.

سال‌هاست که گوگل در کنار توسعه‌ی جنبه‌های دیگر سرویس‌های ابری خویش، روی OCR هم کار کرده تا دقت و سرعت تشخیص حروف بهبود یابد. البته در کنار تلاش برای توسعه‌ی این تکنولوژی، مشکل دیگری هم پیش روی گوگل قرار گرفت چرا که اسکن کردن متون معمولی و تبدیل به متون دیجیتال، نوعی نقض قانونی کپی‌رایت است!

قبلاً در مورد اسکن کردن متون در اندروید صحبت کردیم، در سایر سیستم عامل‌ها هم به راحتی و با نصب اپلیکیشن‌های مختلف می‌توان عمل اسکن را ساده کرد. اما قدم بعدی، تبدیل عکس به نوشته است. آفیس لنز این کار را انجام می‌دهد ولیکن از زبان فارسی خبری نیست! حداقل فعلاً اینگونه است.

گوگل در حال حاضر در زمینه‌ی تشخیص نوری حروف یا Optical Character Recognition به نقاط خوبی رسیده و روی بیش از 200 زبان مختلف کار کرده است. بدین ترتیب ویرایش و جست‌وجو در متون به زبان‌های مختلف امکان‌پذیر می‌شود. شناسایی 25 سیستم نوشتاری مختلف هم از مزایای تکنولوژی OCR گوگل است.

روش استفاده از OCR این است که ابتدا تصاویر موردنظر خود را روی گوگل‌درایو آپلود می‌کنید و سپس روی فایل‌ها راست کلیک کرده و آنها را با Google Docs باز می‌کنید. گوگل داکس در کنار نمایش فایل تصویری، متن استخراج شده از آن را هم نمایش می‌دهد.

و یک سوال مهم ایرانی‌ها، آیا می‌توان نوشته‌های فارسی را با تکنولوژی OCR گوگل به متن قابل ویرایش تبدیل کرد؟

بله، خوشبختانه زبان فارسی هم پشتیبانی می‌شود.

ببینید:

عکسی حاوی نوشته‌ی فارسی

و نتیجه پس از استفاده از گوگل داکس:

نوشته پس از OCR

دقت بسیار خوب است چرا که تصویر از نوشتاری تایپ شده و واضح تهیه شده حال آنکه در مورد دستخط معمولی دقت OCR گوگل به مراتب کمتر خواهد بود.

تبدیل عکس به نوشته چه قدر تاکنون به شما کمک کرده و با اضافه شدن زبان فارسی به لیست پشتیبانی‌های گوگل چه قدر به شما کمک می‌کند؟