بینایی کامپیوتر چیست؟

نویسنده:
شرکت پیشرو Ai
تاریخ انتشار:
28 مرداد 1403
دیدگاه ها:
دیدگاه‌ها برای بینایی کامپیوتر چیست؟ بسته هستند
What is Computer Vision Featured Image

بینایی کامپیوتر چیست؟ اجازه بدهید با یک سوال شروع کنیم: شما در این صفحه چه چیزی می بینید؟

بینایی کامپیوتر چیست؟

اجازه بدهید با یک سوال شروع کنیم: شما در این صفحه چه چیزی می بینید؟

یک میز سبز که چیزهایی روی آن است در سمت چپ می بینید؛ یک ظرف میوه و یک جعبه ابزار دانلود در سمت راست و مجموعه ای  از نوشته ها که شما می خوانید.

یک تصویر با اجزای متفاوت

بینایی کامپیوتر چیست؟

اجازه بدهید با یک سوال شروع کنیم: شما در این صفحه چه چیزی می بینید؟

یک میز سبز که چیزهایی روی آن است در سمت چپ می بینید؛ یک ظرف میوه و یک جعبه ابزار دانلود در سمت راست و مجموعه ای  از نوشته ها که شما می خوانید.

در واقع مغز ما همه اطلاعات را بدون آنکه متوجه شویم در کمتر از سه ثانیه انجام میدهد.

ولی هنگامی که از کامپیوتر بخواهیم این روند را انجام دهد کار به آسانی انجام پذیر نیست و روند پیچیده ای است که مهندسین و دانشمندان بینایی کامپیوتر به دنبال حل آن هستند.  ولی پیشرفتهای خوبی هم در این زمینه حاصل شده است.

بینایی کامپیوتر به سرعت در حال پیشرفت است؛ کاربردهایی در دنیای واقعی پیدا می کند و در مواردی از انسان در حل بعضی مسایل دیداری جلو می زند. این پیشرفت مدیون دستاوردهای جدید در زمینه هوش مصنوعی و یادگیری عمیق می باشد.

در این مقاله سعی می کنیم به شما بینشی در رابطه با بینایی کامپیوتر و اصول اساسی آن داده شود. لیست مطالبی که در این مقاله آورده شده به قرار زیر است:

  1. بینایی کامپیوتر چیست؟
  2. چگونه بینایی کامپیوتر عمل می کند؟
  3. وظایف مشترک در بینایی کامپیوتر
  4. بینایی کامپیوتر و چالشهای تکنولوژی
  5. نمونه هایی کاربرد بینایی کامپیوتر
  6. بینایی کامپیوتر به طور خلاصه؛ نکات کلیدی.

بینایی کامپیوتر چیست؟

بینایی کامپیوتر درواقع زیر شاخه ای از هوش مصنوعی است که انسان به کامپیوتر نحو دیدن و درک محیط اطراف را میدهد.

گرجه انسان و حیوانات به صورت طبیعی مساله بینایی را از سنین پایین حل می نمایند ولی کمک به کامپیوتر در درک محیط اطراف خود مساله ای است که تا حدود زیادی حل نشده مانده است.

وجود محیط هایی با تنوع بسیار در جهان واقعی کار بینایی ماشین را دشوار می نماید.

بینایی انسان در مقایسه با بینایی کامپیوتر

مختصری در مورد تاریخچه بینایی کامپیوتر

دو دانشمند سوئدی ؛ هوبل و وایزل؛ یک گربه را در شرایط مهار شده قرار داده و یک الکترود به اعصاب بینایی آن متصل نمودند. آنها مجموعه ای از تصاویر را با استفاده از یک پروژکتور به گربه نشان دادند و امید وار بودند که بخش اعصاب بینایی شروع به تحریک نماید.

درحالیکه نمایش تصاویر مفید نبود؛ لحظه با ارزش در هنگام حذف پروزکتور حاصل شد که در آن یک خط صاف روی دیوار ظاهر گردید. در این حالت اعصاب بینایی گربه تحریک گردیدند. بدین صورت دانشمندان متوجه شدندکه لایه های ابتدایی سیستم بینایی عصبی به شکلهای ساده همچون خطوط و منحنیها پاسخ می دهند مانند لایه های اولیه در شبکه های عصبی عمیق. در نتیجه آنها با اسیلوسکوپ این تصاویر را به وجود آوردند و پاسخ مغز را مشاهده نمودند. این آزمایش مقدمه ای بود بر ارتباط بین بینایی ماشین و مغز انسان که باعث می گردد فهم بهتری از شبکه های عصبی مصنوعی داشته باشیم.

آزمایش روی سیستم بینایی گربه

البته قبل از آنکه آزمایشهای بینایی گربه مطرح گردد؛ بینایی کامپیوتر و هوش مصنوعی بر مبنای کامپیوترهای آنالوگ از سالهای 1950 میلادی مطرح شده بودند.

بینایی کامپیوتر و بینایی انسان

اینکه بینایی کامپیوتر بایستی از بینایی حیوانات کپی برداری شود به سال های ده پنجاه میلادی برمیگردد که در آن فیزیکدانان عصبی با طراحی آزمایشهایی سعی در درک بینایی گربه نمودند.

از آن زمان بینایی کامپیوتر با گامهای مهمی در رشد سیستمهای دریافت تصویر و اسکنرهای با دقت بالا و همچنین الگوریتمهای جدید روبرو شده است. سالهای ده شصت میلادی شاهد ظهور قویتر هوش مصنوعی در محیط های علمی بودیم و یکی از جلوه های عملی آن پیاده سازی اولین سیستمهای پایدار تشخیص اتوماتیک الفبا در سال 1974 میلادی بود.

تا سال 2000 بینایی کامپیوتر به زمینه های پیچیده تری وارد شده بود مانند:

تشخیص اشیا

تشخیص صورت

بخش بندی تصاویر

دسته بندی تصاویر

هریک از این زمینه ها به دقت قابل توجهی در طی سالها رسیده بودند.

سال 2010 شاهد مطرح شدن پایگاه داده تصویری ImageNet  با ملیون ها تصویربرچسب گذاری شده بودیم که برای تحقیقات رایگان در اختیار عموم قرار گرفتند. این فرایند دو سال بعد منجر به ظهورمعماری AlexNet  شد که یکی از پیشرفتهای عمده در بینایی کامپیوتر بود و حدود 82000 بار تا به امروزبه آن ارجاع دهی شده است.

هوش مصنوعی مطرح گردید1956
آزمایشهای اعصاب شناختی برای درک بینایی1959
اولین پروژه های بینایی ماشین1960s
رکود در هوش مصنوعی1970s
شبکه های عصبی ابتدایی1990s
تشخیص چهره ابداع شده توسط ویولا و جونز2001
الکس نت (توسط کریزوسکی و همکارانش)2012
و پس از آن VGG ,GoogleNet , …

پردازش تصویر به عنوان بخشی از بینایی کامپیوتر

پردازش تصاویر دیجیتال یک زیر مجموعه از بینایی کامپیوتر است که با فرایندهایی همچون بهبود کیفیت تصویر و درک تصویر با الگوریتمهای مختلف مشخص می گردد.

بیشتر از یک زیر مجموعه، پردازش تصویر در واقع پیش درآمدی بر بینایی ماشین امروزی بوده است که شامل قوانین بهینه سازی و ساختاری بوده که به بینایی ماشین امروزی منجر شده است.

پردازش تصویر به مجموعه ای از وظایف گفته می شود که الگوریتمی را برای آنالیز تصویر پیاده سازی می نمایند.

اکنون با درک بهتری از تئوری پشت بینایی کامپیوتر میتوانیم به جنبه های کابردی آن بپردازیم.

2.چگونه بینایی کامپیوتر عمل می کند؟

شکل 4 تصویری را در پاسخ به این سوال ارایه می دهد.

This image has an empty alt attribute; its file name is What-is-Computer-Vision-Images-5.png
نحوه ی عملکرد بینایی ماشی

گرچه سه مرحله ای که بینایی کامپیوتر را نشان می دهد ساده به نظر می آید، پردازش و درک تصویر فرایندهای سختی می باشند. یک تصویر شامل تعداد زیادی پیکسل است که هر پیکسل کوچکترین واحد نمایش تصویر می باشد.

کامپیوتر ها تصاویر را به صورت آرایه ای از پیکسل ها پردازش می نمایند. هر پیکسل دارای سه مقدار اولیه رنگ قرمز، سبز و آبی می باشد.

همه پیکسلها در کنار هم قرار می گیرند تا یک تصویر دیجیتال را شکل دهی کنند. تصویر دیجیتال در واقع یک آرایه می باشد و بینایی کامپیوتر علم کار با این آرایه ها است. ساده ترین عملیات انجام عملیات خطی بر روی این ماتریس هاست و عملیات پیچیده تر همچون کانولوشن و عملیات غیر خطی مانند کاهش داده ها با پولینگ می باشد.

شکل زیر نمایی است از اینکه چگونه یک کامپیوتر تصویر کوچکی را می بیند.

مقدار عددی نمایشگر مقدار پیکسل در آن نقطه می باشد که 255 مشخص کننده سفید و 0 مشخص کننده سیاهی مطلق می باشند. برای تصاویر بزرگتر ، ماتریسها بزرگتر می باشند.

با این حال آرایه های تصویر لزوما درک کاملی از تصویر به ما نمی دهند. بنابراین لازم است کامپیوترها عملیات پیچیده تری روی آرایه ها انجام دهند و با ترکیب اطلاعات یک پیکسل با پیکسلهای همسایه آن می توانند دریابند که بخشی از تصویر نمایشگر صورت یک انسان می باشد.

نمایی از تبدیل اطلاعات تصویری به آرایه ای از اعداد در کامپیوتر

طراحی یک الگوریتم برای تشخیص یک الگوی پیچیده در تصویر مشخص می کند که تا چه حد می تواند عملکرد طبیعی مغز میتواند پیچیده باشد.

بعضی از عملیاتی که برروی تصویر صورت می گیرد عباتند از:

  1. کانوالوشن. کانوالوشن در پردازش تصویر عبارت از عملی است که در آن یک کرنل قابل آموزش با تصویر کانوالو می شود. به بیان دیگر کرنل (هسته) پیکسل بر پیکسل برروی تصویر می لغزد و المانها با یکدیگر ضرب می شوند.
  2. پولینگ. پولینگ یک عمل غیر خطی است که حجم تصویر را کاهش می دهد . هسته پولینگ برروی یک پنجره عمل می کند و از هر پنجره تنها یک خروجی ایجاد می گردد مانند پولینگ بیشینه که بیشینه پنجره را می دهد یا پولینگ متوسط گیر که متوسط پنجره را میدهد.
  3. تحریک غیر خطی: تحریک غیر خطی به شبکه عصبی حالت غیر خطی می دهد، به این ترتیب امکان انباشته شدن چندین کانولوشن و بلوک های ادغام برای افزایش عمق مدل فراهم می شود

3. وظایف متداول در بینایی کامپیوتر

از لحاظ بنیادی ، وظایف بینایی کامپیوتر آنهایی هستند که کمک می کنند کامپیوتر تصاویر را درک کند و اطلاعات بصری را از جهان واقعی استخراج نماید. این می تواند شامل استخراج، پردازش و آنالیز اطلاعات تصویری برای تصمیم گیری باشد.

روند تکاملی بینایی کامپیوتر از حل مسایل پیچیده به مسایل قابل حل بوده است.  تقسیم زمینه ها به گروه های قابل تفکیکی به محققین کمک کرده مسایل را درک کرده و برروی هریک به طور موثر تمرکز نمایند.

متداولترین وظایف بینایی کامپیوتر که در اصطلاحات هوش مصنوعی نیز یافته می شوند عبارتند از:

دسته بندی تصاویر

دسته بندی تصاویر یکی از مهمترین زمینه های مورد مطالعه از سال 2010 که پایگاه تصویری ImageNet  انتشار یافت بوده است.

دسته بندی تصاویر متداول ترین فرایند مورد توجه بین خبرگان و آماتورهای بینایی کامپیوتر بوده است. مساله در دسته بندی این است که چگونه یک تصویر را به مجموعه ای از تصاویر که قبلا دسته بندی شده اند نگاشت نماییم.

بر خلاف وظایف پیچیده مانند تشخیص اشیائ و بخش بتدی تصاویر که بایستی محل ویژگی ها ی یافته شده را مشخص نماییم ، دسته بندی تصاویر با تصویر به طور کلی برخورد می کند و یک برچسب به تصویر میدهد.

تشخیص اشیا

تشخیص اشیا ، آنچنان که از اسمش مشخص است به معنای تشخیص و مشخص نمودن محل اشیا با یک جعبه مرزی  می باشد.

تشخیص اشیا به دنبال ویژگیهایی از تصویر در یک تصویر یا ویدیو می گردد و آنها را هرزمان ظاهر شوند شناسایی می کند. این کلاسها عبارتند از اتوموبیلها ، حیوانات ، انسانها و هر آنچه که مدل آشکار سازی بر مبنای آن تربیت شده است.

روشهای قبلی از تبدیل هار، ویژگیهای SIFT و HOG  استفاده می نمودند تا ویژگیهای خاصی را در تصویر بشناسند و سپس توسط روشهای بینایی ماشین آنها را دسته بندی کنند.

این روشها علاوه بر اینکه زمان بر بوده و دقت خوبی نداشتند، روی تعداد اشیا قابل تشخیص محدودیت می گذاشتند.

در نتیجه روشهای مبتی بر یادگیری عمیق مانند YOLO ، RCNN ، SSD  که از ملیونها ویژگی استفاده می کردند مطرح شدند که محدودیت های فوق را نداشتند.

آشکار سازی  اشیا معمولا همراه با تشخیص اشیا و دسته بندی اشیا استفاده می شود.

بخش بندی تصاویر

بخش بندی تصاویر به معنی تقسیم تصویر به نواحی مجزایی است که یک شئی را از پس زمینه جدا می کند و یا آنرا از دیگر اشیا تفکیک می نماید..

یک بخش در تصویر مشخص کننده یک ناحیه مشخص یک شئی می باشد . این مساله زمینه ای بوده است که در بینایی کامپیوتر به طور گسترده مورد توجه قرار گرفته است و الگوریتمهایی مانند Watershed  برای آن مطرح شده اند.  آگوریتمهای خوشه بندی معروفی مبتنی بر یادگیری عمیق مانند PSPNet  و FPN و U-Netو SegNet برای آن مطرح شده اند.

مثالی از دسته بندی، آشکارسازی و بخش بندی تصاویر
. نمایی از روشهای مختلف بخش بندی تصویر

تشخیص صورت و انسان در تصاویر

تشخیص صورت زیر مجموعه ای از تشخیص اشیا می باشد. درحالیکه می توان تشخیص صورت را به عنوان مجموعه ای از آشکارسازی ویژگیها در نظر گرفت که در آن نه تنها تشخیص محل، بلکه تشخیص صورت نیز انجام می پذیرد.

سیستم تشخیص صورت به دنبال ویژگی های مشترکی مانند چشمها، لب ها و یا بینی می گردد و صورت را با استفاده از این ویژگیها جایابی می کند.  روشهای متداول تشخیص چهره شامل الگوریتم هار به راحتی در کتابخانه OpenCV  قابل یافتن هستند. روشهای پایدارتری مبتنی به یادگیری عمیق با عنوان FaceNet  مطرح شده اند.

یک تصویر با اجزای متفاوت

تشخیص لبه

تشخیص لبه وظیفه شناسایی لبه های اشیا می باشد. الگوریتمهای تشخیص لبه بر مبنای روشهای ریاضی می باشند که تغییرات ناگهانی و یا ناپیوستگی در روشنایی تصویر را میابند. در انجام بسیاری از وظایف پردازش تصویر ، تشخیص لبه ابتدا  توسط الگوریتمهای معروف مانند Canny   و یا با کانولوشن تصویر با فیلترهای لبه یاب صورت می گیرد.

به علاوه تشخیص لبه اطلاعات مهمی در مورد محتوای تصویر میدهد. در نتیجه در درون تمامی الگوریتمهای یادگیری عمیق  تشخیص لبه با هسته های مشخصی صورت می گیرد.

بازیابی تصویر

بازیابی تصویر به بازیابی یا بازسازی تصاویر محو و قدیمی که به روشی نامناسب گرفته شده و ذخیره شده اند و منجر به کاهش کیفیت تصویر می شود، اطلاق می شود. فرآیندهای معمول بازیابی تصویر شامل کاهش نویز افزودنی از طریق ابزارهای ریاضی است، در حالی که گاهی اوقات، بازسازی نیاز به تغییرات عمده دارد که منجر به تجزیه و تحلیل بیشتر و استفاده از نقاشی درون تصویر Image inpainting)) می شود.

در نقاشی درون تصویری قسمت‌های آسیب‌دیده از یک تصویر با کمک مدل‌های مولد پر می‌شوند که تخمینی از آنچه تصویر سعی در انتقال آن دارد را انجام می‌دهد. اغلب فرآیند بازیابی با یک فرآیند رنگ آمیزی دنبال می شود که موضوع تصویر (اگر سیاه و سفید) به واقعی ترین شکل ممکن رنگ می شود.

نمونه ای از بازیابی تصویر

تطبیق ویژگی

ویژگی‌های بینایی کامپیوتر، مناطقی از تصویر هستند که بیشترین اطلاعات را در مورد یک شی خاص در تصویر به ما می‌دهند.

در حالی که لبه ها شاخص های قوی از جزئیات شی می باشند و. بنابراین، ویژگی‌های مهم، مانند جزئیات محلی‌تر و واضح‌تر – مانند گوشه‌ها، نیز به عنوان ویژگی عمل می‌کنند. تطبیق ویژگی به ما کمک می کند تا ویژگی های ناحیه مشابه یک تصویر را با ویژگی های یک تصویر دیگر مرتبط کنیم.

کاربردهای تطبیق ویژگی در وظایف بینایی کامپیوتری مانند شناسایی اشیا و کالیبراسیون دوربین یافت می شود. وظیفه تطبیق ویژگی ها به طور کلی به ترتیب زیر انجام می شود:

  1. تشخیص ویژگی ها: تشخیص مناطق مورد علاقه عموماً توسط الگوریتم های پردازش تصویر مانند تشخیص گوشه هریس، SIFT و SURF انجام می شود.
  2. تشکیل توصیفگرهای محلی: پس از شناسایی ویژگی ها، منطقه اطراف هر نقطه کلیدی گرفته می شود و توصیفگرهای محلی این مناطق مورد علاقه به دست می آید. یک توصیفگر محلی نشان دهنده منطقه یک نقطه است و بنابراین می تواند برای تطبیق ویژگی ها مفید باشد.
  3. تطبیق ویژگی: ویژگی ها و توصیفگرهای محلی آنها در تصاویر مربوطه مطابقت داده می شوند تا مرحله تطبیق ویژگی ها تکمیل شود.

بازسازی صحنه

یکی از پیچیده ترین مشکلات بینایی کامپیوتر، بازسازی صحنه است . باز سازی صحنه ، بازسازی دیجیتالی سه بعدی یک شی از یک عکس است.

اکثر الگوریتم‌ها در بازسازی صحنه تقریباً با تشکیل یک ابر نقطه در سطح جسم و بازسازی یک شبکه از این ابر نقطه کار می‌کنند.

مثالی از بازسازی صحنه

تجزیه و تحلیل ویدیو

تجزیه و تحلیل حرکت در تصاویر، فرایندی در بینایی ماشین است که به مطالعه اجسام یا حیوانات متحرک و مسیر حرکت بدن آنها اشاره دارد.

تجزیه و تحلیل حرکت به طور کلی ترکیبی از بسیاری از وظایف فرعی، به ویژه تشخیص اشیاء، ردیابی، بخش‌بندی و تخمین جهت است.

در حالی که تجزیه و تحلیل حرکت انسان در زمینه هایی مانند ورزش، پزشکی، تجزیه و تحلیل ویدئویی هوشمند و فیزیوتراپی استفاده می شود، تجزیه و تحلیل حرکت نیز در زمینه های دیگری مانند تولید و برای شمارش و ردیابی میکروارگانیسم هایی مانند باکتری ها و ویروس ها استفاده می شود.

چالش های فناوری بینایی کامپیوتر

یکی از بزرگترین چالش ها در بینایی ماشین، عدم درک ما از نحوه عملکرد مغز انسان و سیستم بینایی انسان است. ما یک حس بینایی پیشرفته و پیچیده ای داریم که می توانیم از آن در سنین بسیار پایین استفاده کنیم اما قادر به توضیح فرآیندی نیستیم که توسط آن می توانیم آنچه را که می بینیم درک کنیم.

علاوه بر این، کارهای روزمره مانند راه رفتن در عرض خیابان ، اشاره به چیزی در آسمان، مشخص کردن زمان با  ساعت عقربه ای، ما را ملزم می کند که اطلاعات کافی درباره اشیاء اطراف خود داشته باشیم تا محیط اطراف خود را درک کنیم.

چنین جنبه هایی با دید ساده کاملاً متفاوت است، اما تا حد زیادی از آن جدایی ناپذیر است. بنابراین، شبیه‌سازی دید انسان از طریق الگوریتم‌ها و نمایش ریاضی نیازمند شناسایی یک شی در تصویر و درک حضور و رفتار آن است.

نمونه هایی کاربردهای بینایی کامپیوتر در زندگی روزمره

در نهایت،  برخی از رایج ترین موارد استفاده از بینایی کامپیوتر را مورد بحث قرار میدهیم.

اتوموبیلهای خودران

احتمالا یکی از محبوب ترین کاربردهای بینایی کامپیوتر در حال حاضر، اتوموبیلهای خودران

است. با توجه به اینکه شرکت‌هایی مانند تسلا مدل‌های نوآورانه‌ای از وسایل نقلیه خودران را ارائه می‌کنند، مشخص است که این صنعت نقش مهمی در توسعه الگوریتم‌های جدید بینایی رایانه ایفا خواهد کرد.

واقعیت افزوده

واقعیت افزوده (AR) روشی برای ارائه تجربه ای از محیط طبیعی ب متناسب با محیط اطراف است. با کمک بینایی کامپیوتری، واقعیت افزوده می‌تواند تقریباً نامحدود باشد.

تصویربرداری پزشکی

تصویربرداری پزشکی یکی از زیرشاخه‌های مهم و مرتبط بینایی کامپیوتر است که در آن تصاویر اشعه ایکس و اسکن‌های سه بعدی مانند MRI در دسته بندی و یا شناخت زودرس بیماری‌هایی مانند ذات‌الریه و سرطان کمک می نمایند.

تشخیص زودهنگام بیماری هایی که با بینایی کامپیوتری امکان پذیر شده است می تواند جان هزاران نفر را نجات دهد.

نمونه ای از بخش بندی تصاویر پزشکی

تجزیه و تحلیل هوشمند ویدیو

بینایی کامپیوتر برای توسعه الگوریتم های پیشرفته در دوربین های امنیتی نظارتی  از طریق روش هایی مانند تخمین وضعیت، تشخیص چهره و شخص و ردیابی اشیا استفاده شده است.

تشخیص اشیا در تجزیه و تحلیل ویدئویی هوشمند (IVA) در هر جایی که دوربین‌های مداربسته وجود دارند استفاده می‌شود – در مکان‌های خرده‌فروشی برای درک نحوه تعامل خریداران با محصولات و در کارخانه‌ها، فرودگاه‌ها و مراکز حمل‌ونقل برای ردیابی طول صف و دسترسی به مناطق  خاص از این توانایی استفاده می شود.

تولید و ساخت و ساز

بینایی کامپیوتر بخشی جدایی ناپذیر از صنایع تولیدی است که در تلاش برای خودکارسازی فرآیندهای خود هستند. با توسعه سیستم های بینایی کامپیوتری مانند تشخیص عیب و بازرسی های ایمنی، کیفیت کالاهای تولیدی افزایش می یابد.

علاوه بر این، سیستم‌های بینایی سه‌بعدی، بازرسی‌های کارآمد را در خط تولیدهایی که توسط انسان امکان‌پذیر نیست، انجام می‌دهند.

استفاده از بینایی ماشین در اتوماسیون

تشخیص کاراکترهای نوری ( OCR )

یکی از قدیمی ترین کاربردهای بینایی کامپیوتر، تشخیص نوری کاراکترها است. الگوریتم‌های ساده تشخیص کاراکتر های نوری در اوایل سال 1974 مطرح شدند و امروزه این تکنولوژی در وضعیت بسیار پیشرفته‌ای قرار دارد .سیستم‌های یادگیری عمیق توسعه یافته اند  که می‌توانند متن را در محیط‌های طبیعی و مکان‌های تصادفی بدون نظارت انسان شناسایی و ترجمه کنند.با استفاده از فناوری بینایی کامپیوتری، سیستم‌های تشخیص اتوماتیک حروف واعداد با بار محاسباتی کم توسعه یافته‌اند که می‌توانند حتی در گوشی‌های هوشمند و دستگاه‌های تلفن همراه نیز کار کنند.

تبدیل تصویر متن به متن با استفاده از تکنولوژی تشخیص کاراکتر نوری

خرده فروشی

بینش کامپیوتری در خرده فروشی به طور بالقوه می تواند تجربه مشتری را با استانداردهای بزرگ تغییر دهد. با وجود فروشگاه‌های هوش مصنوعی مانند «amazon-go» در سرتاسر ایالات متحده، به نظر می‌رسد خرده‌فروشی انقلابی‌ترین نقطه برای بینایی کامپیوتر  در سالهای آینده باشد.

بینایی کامپیوتر به طور خلاصه: نکات کلیدی

در این قسمت خلاصه ای سریع از همه چیزهایی که در این راهنمای بینایی کامپیوتری یاد گرفته ایم، بیان می کنیم:

  • بینایی کامپیوتر زیرشاخه ای از یادگیری عمیق و هوش مصنوعی است که رایانه ها را قادر می سازد تا دنیای اطراف خود را ببینند و تفسیر کنند.
  • استفاده از فناوری بینایی کامپیوتری جدید نیست – قدمت آن به دهه 1950 باز می گردد.
  • در ابتدایی ترین شکل خود، بینایی کامپیوتر در مورد تبدیل یک تصویر به آرایه ای ازاعداد ، پردازش های ساده و درک یک تصویر است.
  • برخی از چالشهای رایج بینایی کامپیوتر الکترونیکی عبارتند از طبقه بندی تصویر، محلی سازی و تشخیص اشیا، و تقسیم بندی تصویر.
  • کاربردهای بینایی کامپیوتری شامل زمینه هایی مانند: فناوری تشخیص چهره، تجزیه و تحلیل تصویر پزشکی، اتومبیل های خودران و تجزیه و تحلیل ویدیویی هوشمند می باشد.
  • امروزه یک سیستم بینایی کامپیوتری می تواند در بعضی اعمال از سیستم بینایی انسان پیشی بگیرد.

مطالب مرتبط

کربن رباتیکس

کنترل هوشمند علف‌های هرز با لیزر و GPUهای انویدیا: انقلاب کربن رباتیکس در کشاورزی

Jetpack جتسون

Jetpack جتسون: راهنمای جامع برای تسلط بر مغز متفکر ربات‌های هوشمند

پردازش تصویر با Jetson Nano

پردازش تصویر با Jetson Nano

شهر هوشمند

انویدیا هوش مصنوعی فیزیکی را با برنامه‌ای جدید به شهرهای اروپایی می‌آورد

کاربردهای Jetson

کاربردهای Jetson: گشودن افق‌های هوش مصنوعی

کاربردهای جتسون در صنعت

تحول هوش مصنوعی صنعتی: کاربردهای جتسون در صنعت