گفتگوی زنده دکتر فرشید عبدی و مهندس طه مکفی درباره یادگیری عمیق و تحول کسب کارها
روز چهارشنبه ۱۳ فروردین ۹۹ ساعت ۱۹، لایو مهمی با موضوع یادگیری عمیق و کاربرد آن در کسبوکار با حضور جناب آقای دکتر فرشید عبدی و جناب آقای مهندس مکفی برگزار شد.
مهندس مکفی در آغاز گفتگو به تاریخچه یادگیری عمیق اشاره کرد و پایه و اساس یادگیری عمیق را شبکههای عصبی مصنوعی بیان کرد. شبکههای عصبی مصنوعی در اواخر دهه ۶۰ میلادی پیشنهاد شد و حدود سالهای ۱۹۶۹ و ۱۹۷۰ بود که اولین مقالات در این حوزه شروع به چاپ شد. تا سال ۲۰۰۰ مشکلی که وجود داشت این بود که سیستمهای پردازشی قوی وجود نداشت و تمام ایدههای اولیه یادگیری عمیق و شبکههای عصبی مصنوعی تنها روی دادههای در حجم کوچک و به اصلاح Toy data قابل انجام بود.
در سال ۱۹۸۹، آقای Yann LeCun که اکنون رئیس دپارتمان علم داده دانشگاه نیویورک هستند به همراه همکارانش مقالهای را در خصوص تشخیص دست خط از روی پاکتهای پستی ارائه دادند و در این مقاله پیشنهادی در خصوص اجرا و حل شبکههای عصبی مصنوعی با استفاده از یک روش معکوس مشتقگیری مطرح نمودند که این موضوع سرمنشأ ارائه یک روش بهینهتر برای حل شبکههای عصبی بود.
بااینحال تا سال ۲۰۰۰ شرکتهای بزرگ ابرکامپیوترهای خوبی نداشتند که بتوانند پیشنهاد Yann LeCun را در سطح بالا و خیلی خوب پیادهسازی کنند.
دکتر عبدی گفتگو را با سؤال در خصوص کاربرد یادگیری عمیق و بهخصوص کاربرد آن در حوزه مشتری و فروش ادامه دادند و اینکه یادگیری عمیق چه کاربردهایی میتواند برای کسبوکارها داشته باشد و کسبوکارها چگونه میتوانند از یادگیری عمیق استفاده کنند و اینکه با استفاده از یادگیری عمیق چه نوع مدلسازیهایی را میتوان انجام داد.
مهندس مکفی ادامه داد که شبکههای عصبی مصنوعی معادلات رگرسیون غیرخطی پیچیده هستند.به همین علت امکان این موضوع وجود دارد که از این شبکههای عصبی مصنوعی برای پیشبینی و مدلسازیهای با نظارت استفاده شود و هم برای مدلسازی بدون نظارت و خوشهبندی. ساختار شبکههای عصبی بهصورت لایه ورودی، لایه پنهان و لایه خروجی است. در لایه ورودی متغیرهای پیشبینی کننده وارد میشوند و در لایه پنهان پردازش انجام میشود و در لایه خروجی هم متغیر هدف ما قرار دارد. بهعنوانمثال متغیر هدف میتواند این موضوع باشد که آیا مشتری به کمپینهای ما پاسخ مثبت میدهد یا خیر. و متغیرهای ورودی، تعدادی از ویژگیهای در دسترس از مشتری مانند سن، جنس، میزان تراکنش و …. باشد.
در مدلهای پایه شبکههای عصبی مصنوعی لایههای پنهان خیلی ساده بودند و پیچیدگی نداشتند. اتفاقی که در یادگیری عمیق افتاد این بود که این لایهها ازلحاظ نوع واکنش و نوع محاسبات ریاضی پیچیدهتر شدند و توانایی اجرای محاسبات پیچیدهتری رادارند.
در یادگیری عمیق دو ساختار اصلی داریم که بسیار پرکاربرد هستند. شبکههای عصبی CNN (Convolutional Neural Network) و شبکههای عصبی RNN (Recurrent Neural Network).
شبکههای عصبی CNN به دنبال یک سری مقایسه هستند. خیلی وقتها در حوزه بینایی ماشین (Machine vision) استفاده میشوند. برای مثال تصویری را تصور کنید که شامل اشیاء مختلف است. شبکههای عصبی CNN به این صورت به کار گرفته میشوند که در این تصویر به دنبال پیدا کردن یک شیء خاص هستند. لایههای پنهان CNN به این صورت است که در قسمتهای کوچک تصویر زوم میشود و ویژگیهایی (Features) را از آن قسمت خارج میکند و درنهایت آن ویژگی در یک سری لایههای ادغام (pooling layers) باهم ترکیب میشوند و نتیجه را ارائه میکند.
در CNN لایههای پنهان مختلفی وجود دارد که هرکدام از این لایهها مختصات معادلاتی خاص خودشان رادارند. CNN ها بیشتر روی طبقهبندی تصاویر، طبقهبندی ویدئو و … کاربرد دارند. مهمترین مثالی که از کاربرد CNN میتوان ارائه نمود شرکت تسلا است. تسلا یکی از بزرگترین وبرترین شرکتهای تولیدکننده ماشینهای خودکار در دنیا است. حجم زیادی از تکنولوژی که شرکت تسلا در حال استفاده از آن است بر اساس شبکههای عصبی CNN است. ماشینهای تسلا دوربینهای مختلفی دارند که دائماً در حال گرفتن عکس و تجزیهوتحلیل این تصاویر و تشخیص اجزا مختلف داخل تصاویر است.
گروه بعدی شبکههای عصبی RNN هستند. در بیشتر مواقع از این دسته از شبکههای عصبی هنگامی استفاده میشود که در دادهها سریهای زمانی داریم یا یک سری بخش و توالی (sequence) در دادهها وجود دارد. بهعنوانمثال بحث Customer Journey identification را در نظر بگیرید و هنگامیکه یک کسبوکار میخواهد بداند که مشتری او در کانالهای مختلفی که کسبوکار دارد چگونه رفتار میکند. درواقع میتوان نقشه تجربه مشتری به ازای اومنی چنل (کانالهای چندگانه) را به کمک این تکنیک مورد تحلیل قرار داد. در RNN میخواهیم به کشف توالی بپردازیم و این تحلیل میتواند برای کسبوکارها بسیار مهم و ارزشمند باشد.
بهعنوانمثال دیگری از کاربرد RNN، میتوان به شبکههایی اشاره کرد که از روی توالی کلمات، به پیشبینی این موضوع میپردازد که کلمه بعدی در جمله ما چه خواهد بود که مترجم گوگل هم از تکنولوژی RNN استفاده میکنند. درواقع شبکههای عصبی RNN به دنبال خلاصه کردن توالیها هستند.
دکتر فرشید عبدی در ادامه به طرح این سؤال پرداختند که یادگیری عمیق در کدام حوزهها مهمترین اثر را گذاشته است و آیا مثال مشهودی وجود دارد که یادگیری عمیق به کسبوکارها کمک کرده باشد، باعث افزایش سودشان شده باشد و مشکلات آنها را حل کرده باشد و درنهایت بهعنوان مبنا و الگوی بهکارگیری یادگیری عمیق در کسبوکارها باشد؟
مهندس مکفی در ادامه به بیان این موضوع پرداختند که در حال حاضر جای پیشرفت برای یادگیری عمیق بسیار زیاد است. بهخصوص ازلحاظ پیشرفتهای تکنیکال. مشکلی که در حال حاضر یادگیری عمیق با آن روبرو است این است که پیادهسازی یادگیری عمیق بسیار هزینهبر است. پیشازاین کامپیوترها توانایی پردازش زیادی نداشتند. امروزه GPU ها تولیدشدهاند و واحدهای پردازش خیلی زیادی دارند. ولی ساخت GPU ها هزینه زیادی نیاز دارد. اتفاقی که میافتد این است که با داشتن این تکنولوژی میتوان شبکههای عصبی را اجرا کرد که شامل تعداد زیادی لایه پنهان و تعداد زیادی گره است. یعنی تولید GPU باعث افزایش سرعت شبکههای عصبی عمیق شده است. ولی هزینه زیاد را نباید نادیده گرفت.
در خصوص این موضوع که یادگیری عمیق در کدام حوزهها بهخوبی به کار گرفتهشده مجدداً شرکت تسلا را مطرح کردند که استفاده بسیار خوبی از تکنولوژیهای یادگیری عمیق داشته است. ماشینهای خودکار تسلا دارای مدلهای زیادی هستند که دائماً در حال پردازش هستند و این اطلاعات را همزمان به پدال و فرمان ماشین انتقال میدهند.
یادگیری عمیق در پزشکی هم کاربردهای بسیاری دارد، بهعنوان نمونه در تشخیص سرطانها میتوان از این مدلها استفاده نمود. در خصوص مشتری، باید گفت که بسیاری از مفاهیم هنوز در قدمهای اولیه قرار دارد. بهعنوانمثال همانطور که گفته شد سفرهای مشتری در کانالهای مختلف را با استفاده از یادگیری عمیق میتوان تحلیل کرد که این موضوع هنوز در مراحل ابتدایی خود قرار دارد ولی آینده خیلی روشنی دارد.
مهندس مکفی در خصوص کاربرد یادگیری عمیق در کسبوکارها به ارائه مثالی از یک شرکت پرداختند که وبسایت کسبوکارها را با استفاده از CNN موردبررسی قرار میدهد و درنتیجه این تحلیل برای کسبوکار مشخص میکند که کدامیک از صفحات وبسایت موجب دفع مشتریان میشود و واضح است که چنین کاربردی میتواند برای کسبوکار بسیار مفید باشد.
بهعنوان مثالی دیگر در حوزه مشتری، آقای Dan Tan یک شبکه عصبی CNN را ارائه کردند که قابلاستفاده برای سایتهای تبلیغ محصول، سایتهای اجاره آپارتمان و خانه از آن استفاده میشد. بهعنوانمثال در خصوص سایت اجاره خانه، این شبکه عصبی به پیشبینی این موضوع میپردازد که با توجه به ویژگیهای هرکدام از مشتریان، بهتر است چه عکسهایی از چه قسمتهایی از خانه یا آپارتمان به مشتری نشان داده شود که باعث ترغیب بیشتر مشتری شود.
دکتر فرشید عبدی همچنین به طرح سؤالی در خصوص کاربرد یادگیری عمیق در حوزه مالی و بورس پرداختند و مهندسی مکفی در این خصوص توضیح دادند که حتی در آمریکا شرکتهای مالی هنوز در خصوص استفاده از این ابزارها عقب هستند و هنوز دیدگاه سنتی خود را در خصوص مدلسازی استفاده میکنند. روشهای یادگیری عمیق بر اساس RNN علیالخصوص تکنیک LSTM که کارش پیشبینی سریهای زمانی است در حوزه بورس کاربرد زیادی دارد.
سؤال دیگری که دکتر فرشید عبدی مطرح نمودند در خصوص مسیر یادگیری این موضوع بود و چه تکنولوژیها و ابزارهایی برای یادگیری عمیق موردنیاز است؟ و همچنین چطور میتوان از حالت یک فرد مبتدی وارد این کار شد و به یک متخصص در این حوزه تبدیل شد.
مهندس مکفی در خصوص مسیر یادگیری به آموزشهای آقای Andrew Ng اشاره کردند و گذراندن این دوره را بسیار مفید دانستند. همچنین شرکت در یک دوره و یادگیری مفاهیم اولیه آماری و ریاضیات را بسیار مفید دانستند. در ادامه و در قدم بعدی یادگیری به اجرای پروژه اشاره داشتند و بهعنوانمثال بازسازی مقالهها و کدهایی که پیشازاین توسط افراد دیگر انجامشده است را بهمنظور پیشرفت در این حوزه بسیار مهم دانستند.
در خصوص ابزارها نیز به پایتون و استفاده از بستههای tensorflow و keras اشاره کردند. و همچنین توضیح دادند که هنوز یک پلتفرم visual همانند رپیدماینر برای یادگیری عمیق وجود ندارد.
در ادامه بحث دکتر فرشید عبدی در خصوص بازار کار این حوزه سؤالی را مطرح نمودند و مهندس مکفی به توضیح این موضوع پرداختند که ازلحاظ بازار کار در دسته شغلهای بسیار پرطرفدار قرار دارد و هرسال بهصورت مشهودی به شغلهای مرتبط با یادگیری عمیق و علم داده اضافه میشود و هنوز به نقطه اوج یادگیری عمیق نرسیدهایم و حداقل در پنج یا شش سال آینده بازار کار به همین خوبی خواهد بود و آمارها نشان از رشد این حوزه دارد.
در پایان نیز مهندس مکفی گفتگو را با سخنی از Andrew Ng پایان دادند که «هوش مصنوعی مانند تکنولوژی برق میماند بهطوریکه در آینده نزدیک به خانههای ما راه پیدا میکند و هرروز از آن استفاده خواهیم کرد.»