بینایی کامپیوتری در ورزش: کاربردها، چالشها و مجموعه دادههای ورزشی
برخی افراد ورزش را برای حفظ سلامتی و آگاهی ذهن انجام میدهند، در حالی که برخی دیگر صرفا از تماشای مسابقات ورزشی با دوستان خود لذت...
برخی افراد ورزش را برای حفظ سلامتی و آگاهی ذهن انجام میدهند، در حالی که برخی دیگر صرفا از تماشای مسابقات ورزشی با دوستان خود لذت میبرند. صرف نظر از سبک زندگی و ترجیحات ما، ورزش قطعاً بخش جداییناپذیر از واقعیت زندگی ما است. مانند هر حوزه مهم دیگری از زندگی روزمره و اقتصاد، ورزش نیز به طور اجتنابناپذیری تحت تأثیر پیشرفتهای تکنولوژی قرار میگیرد.

امروزه تحلیلهایی که صورت در لحظه در فوتبال انجام می شوند یا خودروهای مجهز به سنسور در مسابقات فرمول یک دیگر صرفا تخیل ما نیستند و به واقعیت پیوسته اند. در واقع، پیشرفت های انجام گرفته بسیار فراتر از این موارد است: پیشرفتهترین شرکتها در حال حاضر از هوش مصنوعی و کاربردهای بینایی کامپیوتری در ورزش استفاده میکنند و با چالشهای مختلفی را در این حوزه برطرف می کنند. با توجه به تأثیر زیادی که فناوری در ورزش ایجاد کرده است، شکی نیست که استفاده از هوش مصنوعی و یادگیری ماشین باعث حرکت رو به جلویی خواهد شد.
در این مقاله، ما به طور خاص بر نقش بینایی کامپیوتری در ورزش از طریق تقسیم بندی زیر تمرکز خواهیم کرد:
- بینایی کامپیوتری به طور خلاصه
- کاربردهای بینایی کامپیوتری در ورزش
- چالش ها و محدودیت ها
- مجموعه داده های ورزشی
- نتیجه گیری های کلیدی
بینایی کامپیوتری به طور خلاصه
بینایی کامپیوتری بیانگر توانایی رایانه ها یا ماشین ها برای پردازش اطلاعات بصری مانند تصاویر دیجیتال، ویدیوها و موارد دیگر است.
بدون مقدمه بیشتر، بیایید به موارد استفاده از برنامه های بینایی کامپیوتری در ورزش بپردازیم.
استفاده از بینایی کامپیوتری در ورزش موضوعی نسبتاً جدید است. موارد استفاده از هوش مصنوعی و یادگیری عمیق در حال حاضر در حال تغییر تعدادی از بخش های ضروری زندگی ما از جمله سلامت، امنیت و البته ورزش هستند.

اکثر ورزشها شامل حرکات سریع هستند که دنبال کردن و درک آن با چشم غیرمسلح دشوار است. توانایی دنبال کردن این حرکات اولین و مهمترین کاربرد یادگیری ماشین در ورزش است. علاوه بر این، فناوری بینایی کامپیوتری در ورزش به پردازش حجم عظیمی از دادههای بصری دریافت شده در طول برگزاری بازیها برای تصمیمگیری مربوط به مسابقه به صورت لحظه ای، توسعه طرحهای آموزشی جدید و موارد دیگر کمک میکند. این راهحلهای بینایی کامپیوتری در جمعآوری دادهها، تحلیل ورزشی و کسب آگاهی بسیار مثمر ثمر هستند. در زیر به برخی از کاربردهای اخیر بینایی کامپیوتری در ورزش اشاره شده است:
ردیابی بازیکنان
ردیابی بازیکنان در زمین یکی از محبوبترین وظایف بینایی کامپیوتری در ورزش است. این موضوع شامل تشخیص یک بازیکن به تنهایی یا دنبال کردن چندین بازیکن به طور همزمان با کادرهای محدود یا حاشیهنویسیهای کلیدی (اسکلتها) است. چرا مربیان یا تحلیلگران به ردیابی عملکرد بازیکن و تیم علاقه دارند؟ دلیل اصلی این است که به ما امکان میدهد نحوه حرکت بازیکنان را به صورت فردی در طول بازی را تجزیه و تحلیل کنیم و الگوهای رفتاری آنها را تشخیص دهیم.
یک سیستم بینایی کامپیوتری نه تنها میتواند بازیکنان تیمهای ورزشی را تشخیص داده و ردیابی کند، بلکه میتواند اطلاعات معنایی را نیز تولید کند. یادگیری ماشین میتواند زمینه را برای اقدامات بازیکنان ایجاد کند و بررسی کند، فرض کند یا پیشبینی کند که آیا بازیکن توپ را حفظ کرده، پاس میدهد، میدود، دفع می کند یا قرار است عمل دیگری را انجام دهد.
استفاده از فناوری در ورزش مزیت های دیگری را نیز دارد. برای مثال یک سیستم مبتنی بر بینایی کامپیوتری میتواند موقعیتهای بهینه را برای یک بازیکن پیشنهاد کند و مقایسهای با موقعیتهایی دیگر در لحظه در آن بازی خاص نشان دهد. به این ترتیب، بازیکنان به وضوح مناطق بهتر را مشاهده خواهند کرد و مربیان قادر خواهند بود عملکرد بازیکنان را بهتر تجزیه و تحلیل کنند.

ردیابی توپ
ردیابی حرکت توپ برای استخراج اطلاعات از ورزشهای مبتنی بر توپ، به ویژه ورزش های دارای راکت یا ورزشهای توپ و چوب مانند تنیس، کریکت، بدمینتون و موارد دیگر اهمیت زیادی دارد. مدلهای بینایی کامپیوتری میتوانند به ضبط حرکت توپ در سه بعد، نشان دادن دقیق محل برخورد توپ با زمین و حتی پیشبینی مسیر آینده آن برای تعیین اینکه آیا توپ به راکت برخورد میکرده است یا خیر، کمک کنند. به عبارت دیگر، سیستمهای ردیابی توپ مبتنی بر بینایی کامپیوتری می توانند در موارد زیر کمک کننده باشند:
تشخیص و ردیابی توپ و پیشبینی نتایج بازی هنگامی که صحبت از ورزشهای خاصی مانند بسکتبال، والیبال و فوتبال میشود. این نوع ردیابی توپ در این ورزش ها دشوارتر است زیرا توپ از نمای پشت بازیکنان غیر قابل مشاهده است، علاوه بر این تعاملات بازیکنان با توپ نیز میتواند سریع و غیرقابل پیشبینی باشد.

پیشگیری از آسیب
بسیاری از مردم برای رفع نیازهای رو به رشد خود، بازسازی ذهنی و فاصلهگذاری اجتماعی به کلاسهای مجازی روی میآورند. به عنوان مثال، ورزش هایی مانند پیلاتس و یوگا به اندازه کافی آسان است که امکان انجام آن ها در منزل ممکن باشد، اما برای مبتدیان مهم است که در یک یا دو کلاس توسط یک مربی باتجربه و در یک محیط خصوصی یا گروهی، برای یادگیری نحوه ورزش ایمن و جلوگیری از آسیبها شرکت کنند. اینجاست که بینایی کامپیوتری، به ویژه به منظور تخمین وضعیت وارد میشود. تخمین وضعیت یک وظیفه بینایی کامپیوتری است که هدف آن پیشبینی و ردیابی مکان یک شخص یا شی و برنامههای مبتنی بر تخمین وضعیت 3 بعدی برای کمک به مربیان تناسب اندام بسیار کارا هستند. با استفاده از دادههای فراوان ردیابی حرکت، این فناوریها میتوانند هر حرکتی کاربر را تجزیه و تحلیل کنند و بازخورد زنده دقیقی را در اختیار آنها قرار دهند. این نوع همکاری با یک مربی مجازی به دریافت بازخورد در لحظه و جلوگیری از آسیب هنگام ورزش کمک میکند.

بهبود تجربه بیننده
مزایای بهره گیری از بینایی کامپیوتری در دنیای ورزش تنها محدود به زمین و محل های تمرین نیست، و حتی میتواند تماشای یک مسابقه را برای طرفداران دلپذیرتر کند. به جای ارائه یک تصویر پانوراما از کل زمین دوربین ها میدانند کجا و چه زمانی تمرکز کنند، دوربینهای مبتنی بر بینایی کامپیوتری میتوانند به طور خودکار صحنههایی از وقایع رخ داده در زمین ارائه دهند. علاوه بر این دوربینها میتوانند برای نظارت و تجزیه و تحلیل واکنشهای طرفداران در طول بازیها نیز استفاده شوند که این کار به نوبه خود به تعامل بیشتر بینندگان کمک می کند.

برگزاری جلسات تمرینات بهتر
برای تجزیه و تحلیل عملکرد بازیکنان نیاز به استفاده از بینایی کامپیوتری است، نرمافزار تشخیص شی ورزشکاران را ردیابی میکند و ایرادات تکنیکی آنها را نیز به صورت برجسته مشخص می نماید. با یک تحلیل آماری پیشرفته، بازیکنان نه تنها میتوانند اشتباهات خود را متوجه شوند بلکه می توانند از اشتباهات حریفان خود نیز بیاموزند.

چالشها و محدودیتها
بینایی کامپیوتری در ورزش به شدت به سیستمهای دارای دوربین برای به دست آوردن و سپس پردازش فیلمهای ورزشی وابسته است. معمولاً چندین دوربین نزدیک به محل برگزاری رویداد، مانند حاشیه زمین تمرین یا سکوهای استادیوم در طول یک مسابقه قرار میگیرند. زاویه، موقعیتدهی، سختافزار و سایر تنظیمات فیلمبرداری برای هر ورزش و حتی هر مسابقه متفاوت است. این موضوع یک چالش خاص برای سیستمهای بینایی کامپیوتری ایجاد میکند زیرا باید دوربین ها تنظیم شده و متناسب با مسابقات خاص باشند. چند چالش دیگر عبارتند از:
تجهیزات فیلمبرداری پیشرفته برای بسیاری از باشگاههای ورزشی و بخشهای تحلیل عملکرد در دسترس نیست. دوربینهای پخش مسابقات اغلب تغییر میکنند پان، کج و بزرگنمایی تصاویر که چالشهای اضافی برای سیستمهای پردازش ویدیوی بینایی کامپیوتری برای تنظیم دادههای پویا ارائه میکند. در برخی موارد، ممکن است برای سیستمهای بینایی کامپیوتری که ویدیوها را پردازش میکنند، تمایز بین پسزمینه و بازیکنان، بازیکنان و اشیاء، بازیکنان با لباس یکسان و موارد دیگر چالشبرانگیز باشد. با این حال، بینایی کامپیوتری تا حدودی این کاستیها را برطرف کرده است. به عنوان مثال، رایانهها اکنون میتوانند بین زمین، بازیکنان و سایر اشیاء و پیشزمینه به دلیل پردازش تصویر تمایز قائل شوند. همچنین، الگوریتمهای تقسیمبندی مبتنی بر رنگ میتوانند چمن را با رنگ سبز آن تشخیص دهند که تشخیص منطقه زمین، فرایند ردیابی بازیکنان متحرک و شناسایی توپ را تسهیل میکند.
مجموعه دادههای ورزشی
برای علاقهمندان به کسب اطلاعات بیشتر در این موضوع و آزمایش بینایی کامپیوتری در صنعت ورزش، در اینجا لیستی از مجموعه دادههای آماده عمومی قرار داده شده است.
1- مجموعه داده طبقهبندی تصویر حالات یوگا
این مجموعه داده حاوی مجموعاً 5994 فایل تقسیم شده بین 107 دایرکتوری (پوشه) است که هر کدام یک نوع یوگای متمایز را نشان میدهند. این مجموعه داده میتواند به حل وظایف تخمین حالات در برنامههای یوگا کمک کند.
2- مجموعه داده OpenTTGames
OpenTTGames یک مجموعه داده عمومی با پنج ویدیوی آموزشی و هفت ویدیوی آزمایشی برای وظایف بینایی کامپیوتری در تنیس روی میز است. هر ویدیو شامل فایلهای نشانهگذاری مختصات توپ، یک پوشه با ماسکهای تقسیمبندی و مجموعاً 4271 رویداد دستی با برچسب 3 کلاس – بازگشت توپ، برخورد با تور و رویدادهای خالی است.

3- NBA SportVU
مجموعه داده NBA SportVU در GitHub در دسترس عموم قرار دارد. این مجموعه داده شامل مسیرهای حرکت بازیکن و توپ برای 631 بازی از فصل 2015-2016 NBA است. دادههای ردیابی در قالب فایل JSON است و هر لحظه شامل اطلاعاتی در مورد هویت بازیکنان در زمین، هویت تیمها، دوره، زمان بازی و زمان شوت است.

4- PoseTrack
یک مجموعه داده منبع باز برای تخمین وضعیت انسان و ردیابی مفصل در ویدیو است. PoseTrack با داشتن مجموعههای آموزشی و آزمایشی، موارد زیر را پوشش میدهد:
- 1356 دنباله ویدیویی 46K
- فریم ویدیویی با حاشیهنویسی 276K
- حاشیهنویسی وضعیت بدن

5- KTH Multiview Football Dataset II
مجموعه داده KTH Multiview Football II که برای تحقیقات دانشگاهی در دسترس است، شامل دو مجموعه اصلی با برآورد حالت 3 بعدی و 2 بعدی است. مجموعه 3 بعدی به تنهایی شامل 800 فریم زمانی، ضبط شده از 3 نما (2400 تصویر)، 2 بازیکن مختلف و دو دنباله در هر بازیکن با 14 مفصل با حاشیهنویسی است.

نکات کلیدی
هوش مصنوعی در حال پیدا کردن راه خود در ورزش های مختلف، از بیسبال گرفته تا فوتبال و حتی گلف است. در این مقاله، به برخی از رایجترین موارد استفاده از مدل بینایی کامپیوتری در ورزش پرداختیم و مثالهایی از برنامههای موجود را ارائه دادیم. محبوبترین وظایف بینایی کامپیوتری در ورزش شامل ردیابی بازیکن و توپ، تخمین وضعیت برای پیشگیری از آسیب، تقسیمبندی برای تمایز پسزمینه از بازیکنان و موارد دیگر است.