نحوه عملکرد CPU برای گوگل: هوش مصنوعی رایگان. هوش مصنوعی گوگل بازی کروکودیل را پیشنهاد می کند

29.05.2019 اینترنت، وای فای، شبکه های محلی

یادگیری ماشینی گوگل با 99.9 درصد اثربخشی هرزنامه را مسدود می کند

گوگل در وبلاگ خود از استفاده از یادگیری ماشینی مبتنی بر TensorFlow خبر داد که مانع از رسیدن هرزنامه به جیمیل می شود.

این فناوری قادر است 99.9 درصد از هرزنامه ها را مسدود کند، که از نظر فیزیکی به این معنی است که هر روز 100 میلیون پیام هرزنامه اضافی بررسی می شود.

این 100 میلیون پیام هرزنامه اضافی را از کجا پیدا کردیم؟ ما اکنون دسته‌هایی از هرزنامه‌ها را مسدود می‌کنیم که قبلاً شناسایی آنها بسیار دشوار بود. استفاده از TensorFlow به ما کمک کرده است که پیام‌های حاوی تصاویر، پیام‌هایی با محتوای جاسازی شده پنهان و پیام‌هایی از دامنه‌های تازه ایجاد شده را که سعی می‌کنند پیام‌های هرزنامه کم حجم را در بین ترافیک قانونی پنهان کنند، مسدود کنیم.

با توجه به اینکه ما قبلا اکثریت قریب به اتفاق هرزنامه ها را در Gmail مسدود کرده ایم، مسدود کردن میلیون ها نفر دیگر با چنین دقتی یک دستاورد است. TensorFlow به ما کمک می‌کند تا هرزنامه‌هایی را که کمتر از 0.1 درصد به صورت مخفیانه از بین می‌روند، بدون مسدود کردن تصادفی پیام‌هایی که برای کاربران مهم هستند، دستگیر کنیم.».

لنز گوگل یاد گرفته است که میلیاردها شی را تشخیص دهد

3 ژانویه

گوگل اعلام کرد که ابزار عکاسی هوش مصنوعی آن، لنز، اکنون می تواند بیش از یک میلیارد شی را شناسایی کند.

این افزایش قابل توجهی در قابلیت ها در مقایسه با نسخه اول ابزار است که در ابتدا قادر به شناسایی حدود 250 هزار شیء بود. این ابزار بر روی سیستم Google DeepMind آموزش داده شده است.

در همان زمان، یک میلیارد مورد از موارد ارائه شده در Google Shopping به دست آمد. این بدان معنی است که در بین آنها نمی توانید چیزهایی را پیدا کنید که در فروش نیستند. حتی کنسول های بازی دهه 90 یا اولین نسخه های کتاب های قدیمی را دیگر نمی توان از طریق لنز پیدا کرد. با این حال، در میان محصولات مدرن، یافتن موقعیت آسان خواهد بود.

گوگل از هوش مصنوعی برای پیش بینی تاخیر پروازها استفاده می کند

2 فوریه 2018

اطلاعات مربوط به تاخیر پرواز بسیار مفید است، اما اعلام تاخیر اغلب به شرکت هواپیمایی بستگی دارد و آنها همیشه علاقه ای به به روز رسانی سریع اطلاعات ندارند. اکنون گوگل در این مورد کمک خواهد کرد.

این شرکت خدمات پروازهای خود را به روز کرد، که در آن نه تنها شروع به گزارش تاخیرهای احتمالی پرواز کرد، بلکه احتمال آن را نیز ارزیابی کرد. برای انجام این کار، سیستم یادگیری ماشینی از داده‌های تاریخی برای پیش‌بینی تاخیرها استفاده می‌کند و در صورت وجود بیش از ۸۰ درصد احتمال تاخیر، پروازها را برجسته می‌کند. در همان زمان، گوگل خاطرنشان می کند که هنوز نباید برای هواپیما دیر بیایید، زیرا حتی احتمال 99٪ به این معنی نیست که هواپیما طبق برنامه پرواز نمی کند. اما چنین پیش بینی می تواند به شما بگوید که چقدر زمان اضافی را باید در فرودگاه بگذرانید.

همچنین، سرویس به روز شده گوگل به شما کمک می کند در پرواز خود صرفه جویی کنید. تا کنون برای 3 شرکت هواپیمایی کار می کند: امریکن، دلتا و یونایتد. به لطف ویژگی‌های جدید، می‌توانید هزینه خدمات اضافی را در کرایه‌های کم‌هزینه، مانند افزایش چمدان دستی یا چمدان‌های اضافی تخمین بزنید و همچنین این هزینه‌ها را با هزینه بلیط‌های معمولی مقایسه کنید.

گاو دریایی را در عکس می بینید؟

15 دسامبر 2017

گوگل نه تنها برای بهبود خدمات خود، بلکه برای کمک به محیط بانان و دانشمندان از هوش مصنوعی استفاده می کند و یک بار دیگر عنوان خود را به عنوان یک "شرکت خوب" تایید می کند.

شبکه عصبی متن باز تنسورفلو به قلب پروژه ای تبدیل شده است که به حفظ جمعیت گاوهای دریایی یا گاو دریایی کمک می کند.

با وجود اندازه چشمگیر آنها، ردیابی حرکات آنها برای زیست شناسان می تواند بسیار دشوار باشد. برای انجام این کار، محققان عکاسی هوایی از اقیانوس با هواپیماهای بدون سرنشین انجام دادند، اما یافتن چنین حیوانات بزرگی کار بسیار دشواری است. برای یک شخص.

در اینجا یکی از این عکس ها از یک پهپاد گرفته شده است:

آیا یک گاو دریایی روی آن می بینید؟

برای پاسخ به پایین اسکرول کنید.

آماندا هاجسون، محققی از دانشگاه مرداک و تیمش با استفاده از نرم‌افزار متن‌باز Google TensorFlow، ردیاب‌ای ساختند که گاو دریایی را در عکس‌ها پیدا می‌کند. نسخه های اولیه این آشکارساز توانستند 80 درصد از این حیوانات را در یک عکس هوایی که توسط پهپاد گرفته شده بود پیدا کنند. محققان امیدوارند در آینده، هوش مصنوعی کار خود را بهبود بخشد.

دانشمندان همچنین معتقدند که هوش مصنوعی می تواند برای جستجوی پستانداران بزرگ دیگر مانند نهنگ های گوژپشت و حتی دلفین ها سازگار باشد.

هوش مصنوعی گوگل در تست IQ بینگ و سیری را شکست داد

2 نوامبر 2017

سه محقق به نام‌های فنگ لیو، یونگ شی و یینگ لیو، یک تست هوش با هدف آزمایش سیستم‌های هوش مصنوعی مختلف ایجاد کردند.

بر اساس نتایج آنها، هوش مصنوعی گوگل با کسب 47.8 امتیاز، باهوش ترین است. برای مقایسه، امتیاز یک نوجوان 18 ساله 96 امتیاز و امتیاز یک نوجوان 6 ساله 55.5 است.

رقبای اصلی گوگل به طور قابل توجهی از آن عقب مانده اند. بدین ترتیب بینگ و بایدو به ترتیب 31.98 و 32.92 امتیاز کسب کردند. بدترین عملکرد سیری اپل با امتیاز 23.9 بود.

محققان خاطرنشان کردند که در حالی که بهترین هوش مصنوعی حتی به یک کودک شش ساله هم نمی رسد، آنها به سرعت فاصله را از بین می برند. در سال 2014، گوگل و بایدو AI به ترتیب 26.5 و 23.5 امتیاز کسب کردند. این به معنای افزایش 80 درصدی هوش در تنها دو سال (برای گوگل) است، بنابراین نگرانی ایلان ماسک در مورد بردگی ما به رایانه های خودمان ممکن است کاملاً بی اساس نباشد.

این مطالعه همچنین هوش مصنوعی را به درجه بندی و انواع بسته به جهت استفاده تقسیم می کند. با تحقیق کامل امکان پذیر است این لینک را بررسی کنید.

گوگل در مورد نسل دوم TPU صحبت کرد

26 مه 2017

در جریان کنفرانس Google I/O، برگزارکنندگان نسل دوم واحد پردازش تنسور (TPU) را که در هوش مصنوعی این شرکت استفاده می‌شود، به نمایش گذاشتند.

مدل جدیدپردازنده را می توان هم برای آموزش و هم برای جستجوی روابط استفاده کرد. و سیستمی متشکل از چهار TPU جدید Cloud نوید عملکرد سیستم یادگیری ماشینی 180 ترافلاپس را می دهد. توسط به گفته گوگل، این تراشه به طور قابل توجهی سازنده تر از راه حل های مبتنی بر GPU است و بنابراین این شرکت قصد دارد پلتفرم Cloud را به توسعه دهندگان تجاری ارائه دهد.

از نظر کارایی، گوگل توضیح داد که آموزش یک مدل ترجمه زبان بزرگ یک روز کامل با 32 پردازنده گرافیکی سطح بالا طول می کشد. همین کار 6 ساعت در یک هشتم خوشه یا روی 8 TPU طول می کشد.

گوگل اولین نسل از TPU را در سال 2015 معرفی کرد. این پردازنده ها در طیف گسترده ای از خدمات ابری این شرکت از جمله جستجو، ترجمه و گوگل فوتوز استفاده می شوند.

Google TPU داده ها را 15 برابر سریعتر از اجزای معمولی پردازش می کند

29 آوریل 2017

دو سال پیش، گوگل مدار یکپارچه خود را به نام واحد پردازش تنسور ایجاد کرد که برای فاز محاسباتی وظایف یادگیری ماشین طراحی شده است.

این شرکت در ابتدا گفت که TPU باید عملکرد هر وات را در کارهای معمولی تا 10 برابر نسبت به CPU ها و GPU های سنتی بهبود بخشد. و اکنون، با به دست آوردن تجربه عملیاتی، این شرکت مطالعه ای در مورد تأثیر عملکرد تراشه های این نوع انجام داد.

معلوم شد که افزایش 10 برابری در بهره وری انرژی بسیار کم بود. در واقع، عملکرد از 30 به 80 برابر نسبت به راه حل های معمولی و بسته به سناریو افزایش یافته است. از نظر عملکرد کامل، گوگل می گوید TPU 15 تا 30 برابر سریعتر از سخت افزار استاندارد است.

این پردازنده نرم افزارهای سفارشی را بر اساس چارچوب یادگیری ماشینی TensorFlow اجرا می کند و بخشی از این شتاب به دلیل همین فریم ورک است. نویسندگان این مطالعه خاطرنشان کردند که برنامه نویسان هنوز فضایی برای بهینه سازی دارند.

گوگل 6 سال پیش نیاز به TPU را دید. این شرکت از یادگیری عمیق در پروژه های مختلف از جمله جستجوی تصویر، عکاسی و ترجمه استفاده می کند. طبیعتاً یادگیری ماشینی فرآیندی نسبتاً نیازمند منابع است. به عنوان مثال، مهندسان گوگل اشاره کردند که اگر افراد به مدت 3 دقیقه در روز از تشخیص گفتار استفاده کنند و بدون TPU انجام شود، شرکت باید تعداد مراکز داده را دو برابر کند.

گوگل بزرگنمایی تصویر هالیوود را ارائه خواهد کرد

22 فوریه 2017

ما مفهوم بهبود تصاویر پیکسلی را از بسیاری از فیلم‌های هالیوود می‌دانیم، اما مانند همیشه، فناوری واقعی از سینما فاصله زیادی دارد. با این حال، مهندسان Google Brain راهی برای نزدیک کردن داستان های علمی تخیلی به واقعیت ارائه کرده اند.

این فناوری جدید از یک جفت شبکه عصبی استفاده می‌کند که تصاویر ۸×۸ پیکسل را پردازش می‌کند تا چهره فرد پنهان شده در پشت آن را بازسازی کند. البته، شبکه های عصبی یک تصویر را بدون پیکسیشن بزرگ نمی کنند، بلکه تصویر جدیدی ایجاد می کنند که می تواند شبیه تصویر اصلی باشد.

همانطور که در بالا ذکر شد، دو شبکه عصبی در فرآیند بازسازی یک چهره نقش دارند. اولین تصویر یک تصویر 8x8 پیکسل را به یک تصویر مشابه با وضوح بالاتر نگاشت می کند. این تصویر به عنوان اسکلت شبکه دوم استفاده می شود که بر اساس تصاویر موجود با نقشه های پیکسلی مشابه، جزئیات بیشتری را به تصویر اضافه می کند. سپس تصاویر حاصل از دو شبکه با هم ترکیب می شوند تا تصویر نهایی ایجاد شود.

البته تصویر بازآفرینی شده دور از واقعیت است، بنابراین این فناوری برای سازمان های اطلاعاتی بی فایده است، اما در صورت نیاز به بزرگنمایی شدید، هنگام پردازش تصاویر مفید است.

فناوری Google RAISR ترافیک تصویر را چهار برابر کاهش می دهد

28 ژانویه 2017

تقریباً همه تعرفه‌های اپراتور تلفن همراه نیاز به استفاده محدود از داده دارند و Google تصمیم گرفته است تا با توسعه فناوری فشرده‌سازی تصویر RAISR - Rapid and Accurate Image Super-Resolution (تصویر با وضوح فوق العاده سریع و دقیق) مصرف را به میزان قابل توجهی کاهش دهد.

اساساً، این فناوری یک روش فشرده سازی سنتی نیست، بلکه بیشتر شبیه یک شکل هنری است که توسط یک سیستم یادگیری ماشین انجام می شود. بنابراین، RAISR با استفاده از الگوریتم‌های ویژه یادگیری ماشین، تصاویر کوچک تصاویر به‌دست‌آمده را با وضوح پایین‌تر بزرگ می‌کند. در نهایت، هوش مصنوعی جزئیات از دست رفته را بازیابی می کند و تصویر را به ظاهر اصلی خود باز می گرداند. در نتیجه، ترافیک انتقال تصویر را می توان تا 75 درصد در مقایسه با نسخه اصلی کاهش داد و در عین حال بیشتر جزئیات قابل مشاهده را حفظ کرد.

تاکنون گوگل این فناوری را فقط برای سرویس +Google و فقط برای تصاویر ارسال شده در این سرویس ارائه می دهد. "در هفته های آینده" این شرکت دامنه این فناوری را به سایر خدمات خود گسترش خواهد داد.

مشخص نیست که آیا گوگل از این فناوری فقط برای خدمات خود استفاده خواهد کرد یا آن را مانند Brotli گسترش خواهد داد، اما مطمئناً مایلیم که آن را به سایت‌های پرتصویر مانند شبکه‌های اجتماعی و فروشگاه‌های آنلاین تقویت کنیم.

هوش مصنوعی گوگل زبان خود را اختراع کرده است

29 نوامبر 2016

نیازی به وحشت نیست، اما هوش مصنوعی گوگل به طور تصادفی (یا نه) زبان مخفی خود را ایجاد کرده است. و این زبان توسط Neural Machine Translation (NMT) به طور مستقل و بدون دخالت انسان اختراع شد.

گوگل یک موتور ترجمه عصبی جدید را در ماه سپتامبر معرفی کرد و به تازگی معرفی شده است. سیستم جدید به شما این امکان را می دهد که کل جملات را بدون تقسیم آنها به قطعات ترجمه کنید و معنی را بهتر منتقل کنید. سیستم NMT خودآموز است، به این معنی که در حین کار خود را بهبود می بخشد.

این سیستم ابتدا برای بهبود ترجمه از انگلیسی به کره ای و بالعکس و سپس از انگلیسی به ژاپنی و بالعکس استفاده شد. مهندسان علاقه مند بودند ببینند آیا این دستگاه می تواند متن را از کره ای به ژاپنی بدون انگلیسی در بین آن ها ترجمه کند یا خیر. و پاسخ معلوم شد "بله"، دستگاه مستقیما متن را ترجمه کرد.

اینکه چگونه هوش مصنوعی گوگل به این امر دست یافته است کمی نامشخص است. معلوم شد که NMT خود را ایجاد کرده است زبان داخلی"اینترلینگوا". به جای کلمات معادل، به مفاهیم و ساختار جمله می پردازد. در نتیجه، NMT ترجمه های دقیق تری نسبت به قبل تولید می کند. سازندگان مترجم ماشین عصبی از اصول عملکرد شبکه عصبی مطمئن نیستند و نمی توانند بگویند که چگونه ترجمه مستقیم بین زبان ها آموزش داده می شود. به عبارت دیگر، هوش مصنوعی گوگل زبان مخصوص به خود را ایجاد کرده است که ما انسان ها به طور کامل قادر به درک آن نیستیم.

Google Translate به تازگی هوشمندتر شده است

26 نوامبر 2016

گوگل ادعا می کند که با ارائه آن برای گوشی های هوشمند و اپلیکیشن های تحت وب، توانسته است ترجمه ماشینی را طبیعی تر کند.

این غول جستجو خاطرنشان کرد که اکنون از «ترجمه ماشین عصبی» استفاده می‌کند که به آن اجازه می‌دهد یک جمله را به جای تقسیم آن به بخش‌ها و سپس ترجمه بیشتر، ترجمه کند. در نتیجه، متن به دست آمده طبیعی تر است نحو بهترو دستور زبان

"در یک تغییر پیشرفت های بیشتری نسبت به 10 سال به دست آمد."باراک توروفسکی، رهبر محصول Google Translate گفت.

علاوه بر زبان انگلیسی، سیستم ترجمه جدید برای هشت زبان دیگر از 103 زبان پشتیبانی شده توسط این سیستم در دسترس است. بنابراین، ترجمه "عصبی" فرانسوی، آلمانی، اسپانیایی، پرتغالی، چینی، ژاپنی، کره ای و ترکی را پشتیبانی می کند. این شرکت خاطرنشان کرد که این زبان ها 35٪ از کل ترجمه های انجام شده توسط این سرویس را تشکیل می دهند. به گفته توروفسکی، این روش می تواند خطاها را بین 55 تا 85 درصد کاهش دهد.

گوگل یاد گرفته است به سوالات دشوار پاسخ دهد

19 نوامبر 2015

همراه با توسعه سیستم های هوشمند در مایکروسافت و اپل، دستیار گوگلهمچنین پیشرفت را نشان می دهد. بنابراین، این شرکت در وبلاگ خود گزارش داد که برنامه Google اکنون بسیار هوشمندتر شده است، زیرا اکنون سؤالات پیچیده ای را درک می کند و به آنها پاسخ می دهد که قبلاً نمی توانست از عهده آنها برآید.

اکنون گوگل می تواند معنای پشت سوال را بفهمد و همچنین هدف سوال پرسیده شده را درک کند.

به عنوان مثال، دستیار مجازی اکنون می فهمد:

درجه مقایسه ای (بالاترین، بزرگترین و غیره)؛
درخواست های سفارش شده (بلندترین بازیکن ماوریک کیست؟)
اتصالات موقت (تیلور سویفت چه آهنگی را در سال 2014 ضبط کرد؟)
ترکیبات پیچیده (جمعیت ایالات متحده در زمان تولد برنی سندرز چقدر بود؟).

اگر اپلیکیشن گوگل مناسب را روی گوشی هوشمند یا تبلت خود دارید، می توانید از قبل سوالات پیچیده مشابهی را از آن بپرسید. البته جستجوی اطلاعات در گوشی هوشمند چندان راحت نیست، اما اگر اکنون می توانید مانند یک شخص با آن صحبت کنید، پس چرا بیشتر از آن استفاده نکنید.

گوگل کد منبع را برای سیستم یادگیری ماشین باز می کند

12 نوامبر 2015

برای جذب هر چه بیشتر تعداد بزرگترتوسعه دهندگان و سرعت بخشیدن به توسعه فن آوری، گوگل تصمیم به منبع باز موتور هوش مصنوعی به نام TensorFlow.

این شرکت مدتی است که روی این پروژه کار می کند و این سیستم توانسته به ثمر بنشیند، مثلاً در Google Photos، امکان شناسایی افراد و مکان ها در عکس ها را فراهم کند. این فناوری همچنین در سرویس گیرنده ایمیل Inbox کار می کند، که نامه را اسکن می کند تا آماده سازی پاسخ ها را تسهیل کند.

ساندار پیچای، مدیرعامل گوگل در وبلاگ خود نوشت: همین چند سال پیش، نمی‌توانستید یک برنامه Google را در خیابان‌های پر سر و صدا فرمان دهید، یا علائم را به زبان روسی با استفاده از Google Translate بخوانید، یا فوراً تصاویر Labradoodle خود را در Google Photos پیدا کنید. برنامه های ما به اندازه کافی هوشمند نبودند. اما در مدت کوتاهی بسیار بسیار باهوش تر شدند. اکنون، به لطف یادگیری ماشینی، می توانید همه این کارها را به راحتی انجام دهید.".

این مدیر خاطرنشان کرد که سیستم TensorFlow سریع‌تر، هوشمندتر و انعطاف‌پذیرتر از سیستم قدیمی ما است، بنابراین می‌توان آن را با محصولات جدید بسیار آسان‌تر و غنی‌تر تطبیق داد. امروز همچنین تنسور فلو منبع باز را نیز داریم. ما امیدواریم که این به جامعه یادگیری ماشینی، از دانشگاهیان گرفته تا مهندسان و علاقمندان، این امکان را می‌دهد تا ایده‌های خود را خیلی سریع‌تر از طریق کدهای کاری به جای مطالعه اسناد به اشتراک بگذارند.".

گوگل تشخیص گفتار را بهبود بخشیده است

29 سپتامبر 2015

در میان تمام شرکت‌های بزرگی که دارای قابلیت صوتی هستند، گوگل به تنهایی ایستاده است. برخلاف سیری اپل و کورتانای مایکروسافت، گوگل دستیار صوتی خود را شخصی سازی نمی کند. علاوه بر این، گوگل بهترین الگوریتم تشخیص را دارد که اکنون بهبودهای بیشتری دریافت کرده است.

در پست اخیر در وبلاگ تحقیقاتی گوگل، نماینده ای از تیم تحقیقات گفتار تغییرات اخیر در الگوریتم تشخیص را مورد بحث قرار داد. این شرکت در حال حاضر از یک شبکه عصبی عمیق استفاده می‌کند، همان شبکه‌ای که تصاویر عجیبی را با هوش مصنوعی «رویاها» تولید می‌کند تا بفهمد در حال حاضر دقیقاً می‌خواهید به گوشی خود چه بگویید. اکنون این شرکت توسعه و استفاده از یک شبکه عصبی بازگشتی را آغاز کرده است. الگوریتم جدیدمدل‌سازی گفتار به آن‌ها اجازه می‌دهد تا وابستگی‌های زمانی را در نظر بگیرند، که به گفته آنها به آنها امکان می‌دهد با مراجعه به صداهای دریافتی، هر قطعه صوتی را بهتر تجزیه و تحلیل کنند.

در نتیجه، کاربران تشخیص گفتار سریع‌تر و دقیق‌تری را تجربه خواهند کرد. این شرکت همچنین ادعا می کند که الگوریتم جدید در محیط های پر سر و صدا در برابر تشخیص مقاومت بیشتری دارد. الگوریتم جدید تشخیص گفتار قبلاً برای برنامه های جستجو در iOS و اندروید و همچنین برای تایپ صوتی راه اندازی شده است.

گوگل در حال توسعه الگوریتمی برای محاسبه کالری از عکس ها است

20 ژوئن 2015

گوگل حق امتیازی برای فناوری Im2Calories به ثبت رسانده است که عکس غذا را تجزیه و تحلیل می کند و تعداد تقریبی کالری آن غذا را تخمین می زند.

فناوری Im2Calories مبتنی بر یک سری الگوریتم‌های هوش مصنوعی است و ابزار تجزیه و تحلیل عکس، البته، تعداد تقریبی کالری غذا را در عکس گرفته شده تخمین نمی‌زند.

این پروژه هنوز در حال توسعه است و انتظار می رود تا چند سال دیگر ظاهر شود. به احتمال زیاد Im2Calories در قالب اپلیکیشن برای اندروید و iOS در آینده ارائه خواهد شد.

یکی دیگر از مکان‌های جالب برای استفاده از این الگوریتم، منابع توییتر و اینستاگرام خواهد بود، زیرا این جایی است که مردم اغلب عکس‌های غذای خود را ارسال می‌کنند. استفاده از محصول در شبکه خودگوگل پلاس بعید است، زیرا غول جستجو علاقه چندانی به پشتیبانی از این پلتفرم ندارد.

اکنون می‌توانید اپلیکیشن‌های مشابهی را برای هر دو پلتفرم محبوب موبایل پیدا کنید، اما شکی نیست که گوگل به لطف سیستم‌های هوش مصنوعی عالی که این شرکت در حال توسعه است، می‌تواند محصول بهتری بسازد.

یک کامپیوتر هوشمند فقط به اندازه افرادی که آن را آموزش می دهند قوی است.

رابرت ایتو

برای گذشتهدر سه تابستان، حدود دوجین دانشمند کامپیوتر بالقوه به دانشگاه استنفورد آمده اند تا در مورد هوش مصنوعی برخی از درخشان ترین رشته ها بیاموزند. شرکت‌کنندگان که از میان صدها متقاضی حذف شده‌اند، به سفرهای یک روزه به شرکت‌های فناوری اطراف می‌روند، با روبات‌های اجتماعی و هگزاکوپترها تعامل می‌کنند، و در مورد زبان‌شناسی محاسباتی (مثلاً وقتی کلمات چند معانی دارند، ماشین‌ها چه کار می‌کنند) و اهمیت مدیریت زمان (بسیار) یاد می‌گیرند. . فریزبی بازی می کنند. اما اگر تصویر ذهنی شما از هوش مصنوعی، گروهی از افراد است که برای بازی‌های ویدیویی مورد علاقه‌شان دشمنان حیله‌گری ایجاد می‌کنند، خب، این چنین نیست. همه دانش‌آموزان اینجا در برنامه تابستانی توسعه آزمایشگاه هوش مصنوعی استنفورد (SAILORS) دخترانی هستند که به تازگی کلاس نهم را به پایان رسانده‌اند و مطالعات آنها بر یافتن راه‌هایی برای بهبود زندگی متمرکز است، نه بهبود بازی آنها: چگونه از هوش مصنوعی برای حفظ جامبو استفاده کنیم. جت ها از مراقبت به یکدیگر؟ برای اطمینان از اینکه پزشکان قبل از ضربه زدن به OR دستان خود را می شویند؟ Fei-Fei Li، مدیر آزمایشگاه هوش مصنوعی استانفورد و یکی از بنیان‌گذاران برنامه Sailors می‌گوید: «هدف ما این بود که آموزش هوش مصنوعی را به‌گونه‌ای مورد بازنگری قرار دهیم که تنوع و دانش‌آموزان را از همه اقشار تشویق کند. وقتی طیف متنوعی از فن‌آوران آینده دارید، آنها واقعاً اهمیت می‌دهند که از فناوری به نفع بشریت استفاده شود.»

وقتی طیف متنوعی از فن‌آوران آینده دارید، آنها واقعاً اهمیت می‌دهند که از فناوری به نفع بشریت استفاده شود.»

گوگل و استنفورد

SAILORS در سال 2015 توسط لی و دانشجوی سابق اولگا روساکوفسکی (اکنون استادیار دانشگاه پرینستون) برای کمک به ایجاد برابری جنسیتی بیشتر در صنعت فناوری ایجاد شد. علت هم شریف و هم فوری است. بر اساس یک نظرسنجی اخیر، تعداد زنانی که به دنبال مدرک علوم کامپیوتر هستند در حال کاهش است. در بخش هوش مصنوعی، زنان کمتر از 20 درصد پست های اجرایی را در اختیار دارند. با توجه به اینکه هر روز افراد بیشتری از هوش مصنوعی استفاده می‌کنند تا زندگی خود را آسان‌تر و کارآمدتر کنند، حوزه بسیار بزرگی است که باید کنار گذاشته شود: هوش مصنوعی چگونه است که اپلیکیشن‌های عکس چهره شما را در بین دیگران تشخیص می‌دهند، نه اینکه به ساحل اشاره کنیم. جایی که عکس را گرفتید. وقتی از شما می‌پرسید فردا هوا چگونه خواهد بود، دستگاه‌هایتان شما را درک می‌کنند. سپس برنامه های کمتر شناخته شده مانند تشخیص رتینوپاتی دیابتی (که اغلب منجر به نابینایی می شود) یا ارسال یک پهپاد در یک ماموریت جستجو و نجات به دورافتاده ترین نقاط جهان وجود دارد.

با فراگیرتر شدن هوش مصنوعی، نیاز به تعادل جنسیتی در این زمینه فراتر از درستی علت رشد می‌کند. هدف هوش مصنوعی تولید ماشین‌هایی برای تکمیل وظایفی است که انسان به طور طبیعی انجام می‌دهد: تشخیص گفتار، تصمیم‌گیری، تشخیص تفاوت بین بوریتو و انچیلادا. برای انجام این کار، ماشین‌ها با مقادیر زیادی اطلاعات – اغلب میلیون‌ها کلمه یا مکالمه یا تصویر – تغذیه می‌شوند، درست همانطور که همه ما از بدو تولد اطلاعات را در هر لحظه بیداری جذب می‌کنیم (در اصل، این یادگیری ماشینی است). هر چه ماشین ماشین های بیشتری ببیند، در شناسایی آنها مهارت بیشتری دارد. اما اگر این مجموعه داده‌ها محدود یا مغرضانه باشند (اگر محققین مثلاً تصاویر ترابانت را درج نکنند)، یا اگر افرادی که در هوش مصنوعی این محدودیت‌ها یا سوگیری‌ها را نمی‌بینند یا آن را به حساب نمی‌آورند (شاید آن‌ها خبره‌های مبهم نباشند. خودروهای آلمان شرقی)، ماشین آلات و خروجی ناقص خواهند بود. این در حال حاضر اتفاق می افتد. در یک مورد، نرم افزار تشخیص تصویر، عکس های مردم آسیا را به صورت چشمک زن شناسایی کرد.

«این فقط در مورد شفافیت در داده ها نیست. ما در واقع باید کاری کنیم که اعداد در مسیر درست حرکت کنند.»

پروژه شامل

چگونه انسان ها آزمایشگاه ها و فضاهای کاری فراگیرتری ایجاد می کنند؟ تعدادی از پروژه ها و افراد در حال انجام این چالش هستند. امسال، لی-که همچنین دانشمند ارشد هوش مصنوعی و یادگیری ماشین در Google Cloud است و دیگران به راه اندازی AI4ALL کمک کردند. هدف این سازمان غیرانتفاعی ملی ایجاد تنوع بیشتر در هوش مصنوعی است و متخصصان ژنومیک، رباتیک و پایداری را به عنوان مربی درگیر کرده است. این بر اساس کار Sailors است، اما همچنین افراد رنگین پوست و دانش آموزان کم درآمد را در سراسر کشور از طریق مشارکت با پرینستون، دانشگاه کالیفرنیا برکلی، و کارنگی ملون، علاوه بر استنفورد، هدف قرار می دهد. لی می‌گوید: «ما همکاران و رهبران صنعت زیادی داشتیم که به سراغ ما می‌آمدند و می‌گفتند: «SILORS عالی است، اما فقط استانفورد است که به چند ده دانشجو در سال خدمات می‌دهد، عمدتاً از منطقه خلیج.» بنابراین AI4ALL در مورد تنوع و گنجاندن است. این فقط جنسیت نیست.»

هوش مصنوعی و ML

تفاوت در چیست؟

اصطلاحات هوش مصنوعی (AI) و یادگیری ماشینی (ML) اغلب به جای یکدیگر استفاده می شوند، اما آنها یکسان نیستند. هوش مصنوعی توانایی ماشین‌ها را در تقلید ظاهری روش‌های تفکر انسان، یادگیری نحوه عملکرد آن‌ها بر خلاف پیروی از دستورات خاص، توصیف می‌کند. ML یکی از کارآمدترین و محبوب‌ترین تکنیک‌هایی است که رایانه‌ها برای به دست آوردن این توانایی به کار می‌برند. در ML، ماشین‌ها نمونه‌ها را برای تشخیص الگوها بررسی می‌کنند.

سایر ابتکارات مشابه عبارتند از Code Next، تلاش گوگل در اوکلند برای تشویق دانشجویان آمریکایی لاتین و آفریقایی تبار به کشف مشاغل در فناوری. DIY Girls، یک برنامه آموزشی و مربیگری STEAM (علم، فناوری، مهندسی، هنر، و ریاضی) برای جوامعی که منابع کمتری در لس آنجلس دارند. و Project Include، که به استارت‌آپ‌های جدید و متوسط کمک می‌کند زنان و رنگین پوستان بیشتری را استخدام کنند. تریسی چو که قبلاً از Pinterest بود، سال گذشته Project Include را با هفت زن برجسته دیگر در صنعت فناوری تأسیس کرد. در سال 2013، چو به طور معروف اعلام کرد که شرکت‌های فناوری باید در مورد تعداد زنانی که استخدام کرده‌اند، صحبت کنند. همان‌طور که اعداد و ارقام به گوش می‌رسید، آنچه را که همه در سیلیکون ولی می‌دانستند ثابت کردند: دنیای فناوری، از بزرگ‌ترین شرکت تا کوچک‌ترین استارت‌آپ، عمدتاً سفیدپوست و مرد است. چو می گوید که Project Include قدم منطقی بعدی بود. او می‌گوید: «بعد از چند سالی که این گزارش‌های داده منتشر شد و تغییرات زیادی اتفاق نیفتاد، تغییری در مکالمه شروع شد. اکنون موضوع فقط شفافیت در داده ها نیست. ما در واقع باید کاری کنیم که اعداد در مسیر درست حرکت کنند.»

این جهت شامل قابل دسترسی تر کردن کار در زمینه هوش مصنوعی برای توده ها است. افراد نسبتا کمی در زمینه هوش مصنوعی مشغول به کار هستند و در حال حاضر ما شاهد روبات هایی هستیم که از افراد مراقبت می کنند و دستیاران شخصی که نیازهای ما را پیش بینی می کنند. با کنترل داده ها و معیارها توسط انسان ها و ماشین هایی که کار را انجام می دهند، ورودی بهتر و بیشتر انسان به معنای نتایج بهتر و بیشتر است.

از بسیاری جهات، دموکراتیک کردن هوش مصنوعی در حال حاضر در راه است. این مثال را در نظر بگیرید: در ژاپن، پسر یک کشاورز از هوش مصنوعی برای دسته‌بندی محصول خیار خانواده‌اش بر اساس ویژگی‌های مختلف استفاده کرد. این همان داستانی است که برای لی جذاب است، کسی که در سن 16 سالگی از چین به ایالات متحده آمد و اطلاعات کمی در مورد کشور پذیرفته شده خود داشت و حتی کمتر در مورد نیوجرسی، جایی که او به آنجا رسید. لی پس از انجام کارهای عجیب و غریب مختلف، از نظافت خانه‌ها گرفته تا سگ‌گردانی و صندوق‌داری در یک رستوران چینی، خود را در پرینستون و بعداً در مدرسه‌ی کارشناسی ارشد در کالتک یافت.

لی به عنوان یک فرد خارجی سه گانه به کار خود می آید: یک مهاجر، یک زن و یک فرد رنگین پوست در دنیایی که مردان سفیدپوست بر آن تسلط دارند. آنچه ممکن است برای هر کس دیگری مانع باشد، برای لی تبدیل شده است. او بیشتر وقت خود را صرف مطالعه بینایی کامپیوتر می کند، بخشی از یادگیری ماشین که او آن را "برنامه قاتل هوش مصنوعی" می نامد. بینایی کامپیوتری داده‌های بصری را تجزیه و تحلیل و شناسایی می‌کند و ممکن است روزی به ایجاد اندام‌های روباتیک پاسخگوتر کمک کند، مثلاً، یا گره‌دارترین اثبات‌های ریاضی را حل کند. اما مانند تمام هوش مصنوعی، کلید این فناوری آموزش ماشین‌ها برای باز کردن انبوهی از اطلاعات از مکان‌ها و دیدگاه‌های مختلف است. در اصل شهروندان بصری جهان بودن - بی شباهت به لی.

پرورش گروهی متنوع از سازندگان برای شکل دادن به آن جهان برای انواع داستان ها و مسائل فنی که دایانا ویلیامز، استراتژیست محتوا، هر روز در ILMxLAB، مرکز رویایی فوق سری لوکاس فیلم، که در آن توسعه دهندگان سرگرمی های تعاملی و همهجانبه ای را ایجاد می کنند، ضروری است. دارث ویدر، شاید الهام گرفته از جهان عظیم جنگ ستارگان. ویلیامز عمیقاً درگیر سازمان های طرفدار فناوری مانند Black Girls Code است و کمبود زنان رنگین پوست در کالج خود را در دهه 80 به یاد می آورد. او می‌گوید: «من همیشه در کلاس‌های ریاضی‌ام تنها بودم، تنها کسی که در کلاس‌های کسب‌وکارم بودم. "این خسته کننده می شود و ترسناک می شود." راه حل او برای نشان دادن بیشتر زنان به سمت فناوری: «آنها را جوان شروع کنید و اعتماد به نفسشان را قوی کنید، به طوری که وقتی وارد اتاق می شوند و تنها آنها هستند، برنگردند».

مایا گوپتا، محقق یادگیری ماشینی در گوگل، در حال تلاش برای بهبود هوش مصنوعی است، البته از زاویه ای متفاوت. او در استنفورد به یک شرکت نروژی کمک کرد تا ترک‌های خطوط لوله گاز زیر آب خود را شناسایی کند. او می‌گوید: «شما نمی‌توانید به خوبی وارد آنجا شوید، بنابراین ما مجبور شدیم از اطلاعات جزئی برای حدس زدن استفاده کنیم. آموزش ماشین‌ها برای ایجاد حدس‌های ظریف، زمین آشنا برای گوپتا است. اگر در یوتیوب به آهنگ «حقیقت» ساکسیفونیست تنور کاماسی واشنگتن گوش می‌دهید و موسیقی بدون زحمت به «Turiya and Ramakrishna» فوق‌العاده آلیس کولترین می‌پیوندد، مانند کار باهوش‌ترین دی‌جی که هرگز نمی‌شناختید، از گوپتا تشکر کنید، که تیمش به رایانه‌ها کمک می‌کند. توصیه های آنها را تنظیم کنید "همه چیز در مورد پیش بینی است، درست است؟" او می گوید. "شما سعی می کنید با داده های محدود حدس بزنید چه خبر است."

او امروز رهبری یک تیم تحقیق و توسعه در گوگل را بر عهده دارد تا از جمله موارد دیگر، دقت بیشتری در یادگیری ماشین ایجاد کند. او می‌گوید: «فرض کنیم می‌خواهم در تشخیص لهجه بوستون و لهجه تگزاسی به همان اندازه دقیق باشم، اما من یک تشخیص‌دهنده گفتار دارم که در تگزاس کمی بهتر است. منصفانه بگویم: «آیا باید افرادی را با لهجه تگزاسی جریمه کنم و به همان اندازه که برای بوستون بد است، تشخیص بدهم؟ و اگر تشخیص افرادی که با لهجه بوستون صحبت می کنند سخت تر باشد، چه؟

گوپتا و تیم او همچنین در حال پالایش سیستم‌هایی هستند که بی‌نهایت شفاف‌تر از طراحان مبتنی بر کربن آن‌ها هستند. امید است که با ماشین‌ها بتوانیم بسیاری از سوگیری‌ها یا فرآیندهای ناخودآگاهی را که افکار انسان را آزار می‌دهند، از بین ببریم - یا حداقل به هنگام ظهور آنها را راحت‌تر تشخیص دهیم. وقتی ماشین‌ها خسته، تحریک‌پذیر یا گرسنه هستند تمرکز خود را از دست نمی‌دهند. یک مطالعه نشان داد که قضات تمایل کمتری به اعطای آزادی مشروط درست قبل از ناهار دارند، زمانی که آنها به جای ساندویچ فکر می کنند. گوپتا می‌گوید: «اندازه‌گیری آنچه واقعاً در ذهن انسان‌ها می‌گذرد دشوار است. ما می‌خواهیم سیستم‌های یادگیری ماشینی ما قابل توضیح باشند، و صادقانه بگویم که بسیاری از آنها در حال حاضر قابل توضیح‌تر از انسان‌ها هستند.

ما می‌خواهیم سیستم‌های یادگیری ماشینی ما قابل توضیح باشند، و صادقانه بگویم که بسیاری از آنها در حال حاضر قابل توضیح‌تر از انسان‌ها هستند.»

از آنجایی که هوش مصنوعی به طور فزاینده ای مفید می شود - البته استفاده از آن آسان تر نیست - فشار برای قرار دادن آن در دستان هر چه بیشتر ادامه دارد. کریستین رابسون، محقق IBM قبل از آمدن به گوگل، قهرمان مشتاق نرم‌افزار متن‌باز مانند TensorFlow است، یک سیستم یادگیری ماشینی که می‌تواند برای بسیاری از کارها، از ترجمه زبان‌ها گرفته تا تشخیص بیماری‌ها و خلق آثار هنری اصیل استفاده شود.

از نظر رابسون، فراگیر بودن در هوش مصنوعی به معنای در دسترس قرار دادن ابزارهای آن برای بیش از افراد ریاضیدانی مانند خودش است. او می گوید: «من از در دسترس بودن یادگیری ماشینی در جهان هیجان زده هستم. ما در مورد دموکراتیک کردن یادگیری ماشینی زیاد صحبت می کنیم، اما من به این موضوع اعتقاد زیادی دارم. استفاده از این ابزارها واقعاً آسان و امکان استفاده از این تکنیک ها برای همه بسیار مهم است."

ادبیات علمی تخیلیو فیلم مدت‌هاست که نمونه‌هایی از AI به خطا رفته است (مری شلی فرانکشتاینسال آینده 200 ساله می شود). امروزه، بسیاری از افراد در این صنعت – از جمله لی، رابسون و چو – کمتر نگران این هستند که هوش مصنوعی چه می‌تواند با ما انجام دهد و بیشتر در مورد آنچه که ما انسان‌ها ممکن است با هوش مصنوعی انجام دهیم، نگران هستند. یک مثال: برنامه نویسان به دستیاران مجازی صدای زنانه می دهند، زیرا، خوب، مردان و زنان به طور یکسان تمایل دارند که یکی را ترجیح دهند. چو می‌گوید: «اما این ایده که دستیاران زن هستند را تداوم می‌بخشد، بنابراین وقتی با این سیستم‌ها درگیر می‌شویم، این تعصب اجتماعی را تقویت می‌کند.» بسیاری از بهترین ذهن‌های این حوزه نگران آنچه در سیستم‌های هوش مصنوعی زندگی واقعی رخ می‌دهد – و بنابراین آنچه که قرار است ظاهر شود. اینجاست که فشار برای تنوع بیشتر در هوش مصنوعی وارد می شود. کمی از این آسان خواهد بود. اما طرفداران آن باهوش، مدبر و متعهد به هدف هستند.

استفاده از این ابزارهای هوش مصنوعی واقعاً آسان و امکان استفاده از این تکنیک ها برای همه بسیار مهم است.

گوپتا می‌گوید: ما باید مطمئن شویم که همه احساس خوشایندی می‌کنند. او دیواری از عکس‌های استادان بازنشسته مهندسی برق در دانشگاه رایس را به یاد می‌آورد که «شبیه من نبودند». رابسون اضافه می کند که ما باید دختران را متقاعد کنیم که هوش مصنوعی جادو نیست. "این ریاضی است."

در SAILORS، دانش‌آموزان در حال یادگیری نحوه استفاده از پردازش زبان طبیعی برای جستجو در رسانه‌های اجتماعی و کمک به امدادرسانی به بلایا هستند. لی می‌گوید: «این به امدادگران کمک می‌کند تا با استفاده از پیام‌های توییتر خود، افراد نیازمند را در زمان واقعی کشف کنند. اثرات کلاس ها و پروژه ها به خوبی پس از تابستان های فراموش نشدنی باقی می مانند. برخی از دانش‌آموزان باشگاه‌های روباتیک خود را در مدرسه راه‌اندازی کرده‌اند، قطعاتی را در مجلات علمی منتشر کرده‌اند و کارگاه‌هایی را در مدارس راهنمایی برگزار کرده‌اند تا انجیل هوش مصنوعی را حتی به دختران جوان‌تر گسترش دهند. برای این دانش‌آموزان، که سوابق و تجربیاتشان به اندازه پروژه‌های بی‌شماری که در اردو انجام داده‌اند، متنوع است، هوش مصنوعی جدیدترین ابزار جالب نیست، بلکه یک نیروی قدرتمند برای موفقیت است. پیش از اولین گردهمایی ملوانان در سال 2015، این برنامه پیام‌هایی را از کمپینگ‌های ورودی به اشتراک گذاشت، از جمله این آرزوی جاه‌طلبانه: "امیدوارم سفر هوش مصنوعی خود را از هم اکنون آغاز کنم تا بتوانم در آینده تأثیری بر جهان بگذارم."

رابرت ایتونویسنده ای ساکن لس آنجلس است. او یکی از همکاران مکرر است نیویورک تایمز, سالن، و لس آنجلسمجله

گوگل یک مرکز تحقیقاتی جدید به نام Google Research را در زوریخ افتتاح کرده است که بر هوش ماشینی تمرکز دارد. اکنون یکی از بزرگترین مراکز تحقیقاتی مرتبط با توسعه هوش مصنوعی در خارج از ایالات متحده است. کشف آن با استراتژی جدید گوگل مرتبط است که شامل معرفی فعال هوش ماشینی به سرویس ها و برنامه ها می شود. امروزه این شرکت از پیشرفت‌هایی در این زمینه در محصولاتی مانند Translate و Photos استفاده می‌کند. و در کنفرانس Google I/O 2016 یک پیام رسان و یک دستگاه خانه هوشمند ارائه شد که از هوش ماشینی نیز بهره می برند. گوگل قصد دارد با افتتاح یک مرکز تحقیقاتی جدید در زوریخ، پیشرفت چشمگیری در این زمینه داشته باشد. ما توانستیم در افتتاحیه این مرکز شرکت کنیم و با چگونگی و چرایی توسعه هوش مصنوعی این شرکت آشنا شویم.

گوگل چگونه هوش مصنوعی ایجاد می کند؟

مرکز تحقیقاتی افتتاح شده در زوریخ بر توسعه در سه حوزه کلیدی برای هوش مصنوعی متمرکز خواهد بود: یادگیری ماشینی، ادراک ماشین، و پردازش و درک گفتار طبیعی. همه آنها برای ایجاد نسل بعدی کامپیوترهایی که بتوانند از مردم و دنیای اطرافشان بیاموزند مورد نیاز هستند.

فراگیری ماشین

هوش ماشینی یا مصنوعی اغلب با یادگیری ماشینی اشتباه گرفته می شود، و اگرچه اولی بدون دومی نمی تواند وجود داشته باشد، اما بر اساس اصول کمی متفاوت است. مفهوم "هوش مصنوعی" خود شامل ایجاد رایانه ای است که فکر می کند، در حالی که "یادگیری ماشینی" توسعه رایانه هایی است که می توانند یاد بگیرند. گرگ کورادو، محقق ارشد یادگیری ماشین در گوگل، تفاوت را توضیح می‌دهد: «برنامه‌نویسی یک رایانه برای هوشمند بودن می‌تواند دشوارتر از برنامه‌نویسی یک رایانه برای یادگیری هوشمند باشد».

امروزه هر کاربر می تواند کار یادگیری ماشین را تجربه کند. پست الکترونیکجیمیل. در حالی که فیلتر هرزنامه سرویس قبلاً از قوانین سختگیرانه ای برای کلمات کلیدی پیروی می کرد، امروزه از نمونه هایی یاد می گیرد. همانطور که ایمیل را فیلتر می کند، بهتر و بهتر می شود. این یکی از ساده‌ترین نمونه‌های استفاده از یادگیری ماشینی است، اما امروزه گوگل در حال ایجاد سیستم‌های خودآموز پیچیده‌تر است.

برای انجام این کار، این شرکت از سه روش یادگیری ماشین استفاده می کند:

1. آموزش تدریس خصوصی- این کار با مثال یاد می‌گیرید، همانطور که فیلتر هرزنامه Gmail ایمیل را فیلتر می‌کند و نمونه‌های بیشتری از پست‌های هرزنامه را دریافت می‌کند. تنها مشکل این روش این است که برای تاثیرگذاری آن باید تعداد زیادی نمونه آماده داشته باشید.

2. یادگیری بدون نظارت- این خوشه بندی داده ها است، کامپیوتر با اشیاء بدون شرح ارائه می شود و سعی می کند الگوهای داخلی، وابستگی ها و روابط بین آنها را بیابد. از آنجایی که داده ها در ابتدا بدون برچسب هستند، هیچ سیگنال خطا یا پاداشی برای سیستم وجود ندارد و راه حل صحیح را نمی داند.

3. یادگیری تقویتی- این روش مربوط به "یادگیری نظارت شده" است، اما در اینجا داده ها به سادگی وارد رایانه نمی شوند، بلکه برای حل مشکلات استفاده می شوند. اگر تصمیم درست باشد، سیستم یک پاسخ مثبت دریافت می کند که آن را به خاطر می آورد و در نتیجه دانش خود را تقویت می کند. اگر راه حل نادرست باشد، کامپیوتر پاسخ منفی دریافت می کند و باید راه دیگری برای حل مشکل پیدا کند.

امروزه، گوگل عمدتاً از یادگیری تحت نظارت برای خدمات خود استفاده می کند، با این حال، این شرکت خاطرنشان می کند که «یادگیری تقویتی» ممکن است پتانسیل بیشتری داشته باشد. ترکیب این دو روش بود که برای ایجاد هوش مصنوعی AlphaGo استفاده شد که توانست بازیکنان حرفه ای Go را شکست دهد. ابتدا کامپیوتر فن هوی (دان دوم) قهرمان گو اروپا را با نتیجه 5-0 شکست داد و سپس با لی سدول بازیکن دان نهم (بالاترین رتبه در گو) بازی کرد و دوباره امتیاز نهایی 4- شد. 1 طرفدار شخص نیست

چرا پیروزی هوش مصنوعی در بازی Go برای توسعه یادگیری ماشین بسیار مهم است؟ واقعیت این است که خود بازی برای یک کامپیوتر بسیار دشوار است. Go از یک تخته گوبان 19×19 خطی استفاده می کند که یک بازیکن سنگ های سیاه و بازیکن دیگر سنگ های سفید را روی آن قرار می دهد تا هر چه بیشتر از تخته را بگیرد. برخلاف شطرنج که هر مهره دارای موقعیت مشخص و حرکت است، در Go بازیکنان فقط توسط تخته محدود می شوند. بنابراین، در طول بازی آنها نه تنها از دانش، بلکه از شهود نیز استفاده می کنند. برای رایانه، پیچیدگی اضافی تعداد زیادی موقعیت های ممکن است (10^170) و همچنین قضاوت در مورد برنده شدن بازی برای آن دشوار است.

بنابراین، دو شبکه عصبی برای AlphaGo توسعه یافت. اولین شبکه "شبکه ارزش" نامیده می شود، موقعیت سنگ ها را در میدان با اعداد 1- تا 1 ارزیابی می کند تا مشخص کند کدام سنگ ها در پیشرو هستند: سفید (-1) یا سیاه (1). اگر موقعیت متعادل باشد و هر بازیکن بتواند برنده شود، مقدار آن نزدیک به 0 خواهد بود. شبکه عصبی صفحه را اسکن می کند و موقعیت سنگ ها را ارزیابی می کند، پس از آن شروع به درک میزان سودمندی سنگ های سفید و سیاه می کند. دومین شبکه عصبی «شبکه سیاست» نام داشت. بر اساس داده های متخصص در مورد حرکات در Go، او نقشه ای را ترسیم می کند که تعیین می کند کدام حرکت در این موقعیت موفق ترین خواهد بود.

بنابراین، "شبکه ارزش" به AlphaGo اجازه می دهد تا موقعیت سنگ ها را در تابلو بفهمد و تعیین کند که چه کسی برنده می شود، و "شبکه سیاست" انتخاب الگوریتم جستجو را آسان تر می کند. گزینه های ممکنحرکت کنید، زیرا بسته به موقعیت سنگ ها آن را محدود می کند.

قبل از ادامه، مهم است که بدانیم "شبکه عصبی" چیست؟ متأسفانه امروزه هیچ تعریف رسمی واحدی از "شبکه عصبی مصنوعی" وجود ندارد. اگر بخواهید آن را به زبان ساده بیان کنید، شبکه عصبی مجموعه ای از مدل های ریاضی است که بر اساس اصل عملکرد شبکه های عصبی بیولوژیکی ایجاد می شوند. نورون های مصنوعی (پردازنده های ساده) به یکدیگر متصل می شوند، سیگنالی را دریافت می کنند، آن را پردازش می کنند و به نورون بعدی می فرستند. هر نورون یک تابع ریاضی ساده است، اما با همکاری یکدیگر می توانند مسائل پیچیده را حل کنند.

چگونه شبکه های عصبی برای AlphaGo آموزش داده شدند؟

ما با داده های بازیکنان حرفه ای Go شروع کردیم. از آنجایی که بازی ها بیشتر ضبط می شوند، ما جفت های زیادی داشتیم: موقعیت به علاوه حرکتی که با آن به دست آمد. یک بازی حدود 300 جفت از این دست را به ما می دهد. هر حرکت در چنین بازی حرفه ای است، زیرا توسط یک متخصص انجام می شود. ما از "یادگیری نظارت شده" برای آموزش شبکه عصبی برای پیش بینی حرکت یک بازیکن حرفه ای در آن موقعیت استفاده کردیم. اینگونه بود که «شبکه سیاست ها» ایجاد شد. بعد، ما به شبکه عصبی اجازه دادیم که هم از موقعیت سنگ های سیاه و سفید، علیه خودش بازی کند. ما نتایج این بازی ها را دوباره در شبکه عصبی بارگذاری کردیم. این در حال حاضر "یادگیری تقویتی" است، هنوز به خوبی مورد تحقیق قرار نگرفته است، اما ما معتقدیم که این آینده یادگیری ماشینی است. علاوه بر این، به لطف شبکه عصبی که علیه خودش بازی می کند، به این نتیجه رسیدیم حجم زیادداده های مربوط به موقعیت سنگ ها روی تخته و همچنین نتیجه بازی ها. بر اساس آنها، ما یک «شبکه معنادار» را آموزش دادیم که یاد گرفتیم بفهمیم سنگ‌های سیاه در چه موقعیت‌هایی برنده می‌شوند و در کدام موقعیت‌ها سنگ‌های سفید. ارزیابی بسیار است پارامتر مهمثور گریپل، دانشمند پژوهشی در پروژه DeepMind گوگل که AlphaGo را توسعه داده است، می گوید: برای ایجاد یک برنامه بازی و به طور کلی یادگیری ماشین، زیرا به راهی برای تعیین پیشرفت در بازی نیاز دارید.

اگرچه AlphaGo بازیکنان حرفه ای Go را شکست داده و به راحتی سایر هوش های مصنوعی توسعه یافته برای بازی را شکست داده است، این تنها دستاورد قابل توجه این سیستم نیست. در بازی دوم با لی سدول، AlphaGo یک حرکت بسیار غیرعادی 37 در خط 5 انجام داد که در ابتدا موفقیت آمیز به نظر نمی رسید، اما سپس به کامپیوتر اجازه داد تا این قسمت از تخته را در اختیار بگیرد. واقعیت این است که اطلاعات کارشناسی که در AlphaGo بارگذاری شده بود چنین حرکاتی را در خود نداشت و می توان این را یکی از اولین جلوه های خلاقیت در اجرای یک کامپیوتر دانست.

امروزه گوگل از کتابخانه نرم افزار متن باز TensorFlow برای یادگیری ماشینی استفاده می کند. این یک API نسل دوم است که برای تحقیقات و همچنین محصولات تجاری Google که از یادگیری ماشینی استفاده می‌کنند، از جمله جستجو، تشخیص گفتار، Gmail و Photos کار می‌کند.

ادراک ماشین

یکی دیگر از زمینه های مهم برای توسعه هوش مصنوعی، ادراک ماشین است. اگرچه رایانه‌ها در دهه گذشته پیشرفت‌های زیادی در تشخیص صداها، موسیقی و متن دست‌نویس داشته‌اند، اما هنوز با تشخیص تصاویر و ویدیوها مشکل دارند. سیستم بینایی انسان به راحتی تصاویر را تشخیص می دهد؛ در هر نیمکره مغز ما یک قشر بینایی اولیه (ناحیه بینایی V1) وجود دارد که شامل 140 میلیون نورون با ده ها میلیارد اتصال بین آنها است. و با این حال، مغز انسان علاوه بر این، از قشر بینایی فراخط (نواحی V2، V3، V4 و V5) برای تشخیص تصویر استفاده می‌کند. بنابراین، دیدن یک گربه خاکستری که روی فرش خاکستری دراز کشیده است برای ما مشکل بزرگی نیست. اما این کار برای یک کامپیوتر بسیار دشوار است.

پیش از این، گوگل عکس‌ها را بر اساس توضیحات فهرست‌بندی می‌کرد، کاربر باید برچسب‌هایی را به عکس‌ها اضافه می‌کرد تا بعدا بتوان آنها را گروه‌بندی یا پیدا کرد. امروزه Google Photos از تشخیص تصویر پیشرفته تری بر اساس «شبکه عصبی کانولوشنال» استفاده می کند. این معماری که توسط دانشمند Yann LeCun ساخته شده است، یکی از بهترین الگوریتم ها را برای تشخیص تصویر دارد. بدون پرداختن به جزئیات، این ساختار چند لایه ای از نورون های مصنوعی است که هر لایه آن تنها بخش کوچکی از تصویر ورودی را به عنوان ورودی می گیرد. با کمک پروژه Deep Dream، امروزه هر کسی می‌تواند دقیقاً ارزیابی کند که یک شبکه عصبی کانولوشن چگونه تصاویر را می‌بیند.

گوگل از پایگاه داده های تصاویر عمومی برای آموزش شبکه عصبی خود استفاده می کند. به عنوان مثال، در سال 2012، گوگل به یک شبکه عصبی آموزش داد تا تصاویر گربه ها را با استفاده از 10 میلیون فریم گربه از ویدیوهای یوتیوب تشخیص دهد.

پردازش و درک گفتار طبیعی

برای اینکه رایانه نه تنها دستورات صوتی، بلکه گفتار طبیعی را نیز درک کند، گوگل از شبکه های عصبی تکراری استفاده می کند.

تشخیص گفتار سنتی صداها را به قطعات کوچک صوتی 10 میلی ثانیه ای تقسیم می کند. هر قطعه از این قبیل برای محتوای فرکانس آنالیز می‌شود و بردار مشخصه‌های حاصل از یک مدل صوتی عبور می‌کند، که یک توزیع احتمال را برای همه صداها خروجی می‌دهد. سپس، در ترکیب با سایر ویژگی‌های گفتاری، از طریق یک مدل تلفظ، سیستم توالی صداهای کلمات صحیح را در زبان و مدل به هم پیوند می‌دهد و تعیین می‌کند که احتمال یک کلمه در زبان مورد استفاده چقدر است. در نهایت، مدل زبان، کلمات و کل عبارت حاصل را تجزیه و تحلیل می‌کند و سعی می‌کند ارزیابی کند که آیا چنین توالی از کلمات در این زبان امکان‌پذیر است یا خیر. اما برای برخی از کلمات در نماد آوایی تعیین اینکه یک حرف در کجا به پایان می رسد و دیگری شروع می شود دشوار است و این برای تشخیص صحیح بسیار مهم است.

گوگل اکنون از یک مدل صوتی مبتنی بر یک شبکه عصبی مکرر با معماری «حافظه کوتاه مدت بلندمدت» استفاده می‌کند. به عبارت ساده تر، این شبکه عصبی در به خاطر سپردن اطلاعات بهتر از سایرین است و همین امر آموزش تشخیص واج در یک عبارت را ممکن می سازد و این امر کیفیت سیستم تشخیص را به میزان قابل توجهی بهبود می بخشد. بنابراین، امروزه تشخیص صدا در اندروید تقریباً در زمان واقعی کار می کند.

هوش مصنوعی: کمک کننده یا تهدید؟

گوگل اذعان می کند که جنبه اخلاقی استفاده از هوش مصنوعی همیشه در دستور کار است. با این حال، این شرکت هنوز معتقد نیست که ما به اندازه کافی به ایجاد رایانه هایی که خودآگاه هستند برای بحث در مورد این موضوع به طور مفصل نزدیک شده ایم. گرگ کورادو می گوید: «کامپیوترها به کندی یاد می گیرند. در حال حاضر، گوگل می تواند هوش مصنوعی بسازد که در یک کار خوب باشد، مانند بازی Go، مانند AlphaGo. اما برای هوش مصنوعی کامل، چندین برابر قدرت محاسباتی مورد نیاز است. امروزه می بینیم که عملکرد پردازنده ها در حال کند شدن است، تقریباً به مرز "قانون مور" رسیده ایم و اگرچه این تا حدودی با افزایش عملکرد کارت های ویدئویی و ظهور پردازنده های تخصصی جبران می شود ، اما این هنوز کافی نیست. علاوه بر این، یکی دیگر از موانع، فقدان مقدار کافی اطلاعات تخصصی است که بتوان از آن برای یادگیری ماشین استفاده کرد. بشریت می تواند همه این مشکلات و نه تنها را ظرف 20، 50 یا 100 سال حل کند، یا ممکن است هرگز حل نشود؛ هیچ کس نمی تواند پیش بینی دقیقی بدهد. بر این اساس، هوش مصنوعی که در فیلم ها می بینیم احتمالاً با آنچه در نهایت به دست می آوریم بسیار متفاوت خواهد بود.

جک همه معاملات و آینده جستجوی گوگل

گوگل در حال حاضر هدف واقعی تری را برای خود در نظر گرفته است - ایجاد دستیارهای مجازی مبتنی بر هوش مصنوعی. امروزه چنین وجود دارد دستیاران مجازیمانند سیری یا گوگل ناو، اما آنها بسیار محدود هستند و از واقعیتی که کاربر در آن قرار دارد جدا هستند. گوگل می خواهد چه کار کند؟ این شرکت معتقد است که یک دستیار مجازی باید دنیای اطراف خود، موقعیت کاربر در این دنیا را درک کند و همچنین بر بستر فعلی در ارتباطات تکیه کند.

"تصور کنید که شما یک چیز باورنکردنی دارید دستیار هوشمندو شما به او می گویید: در این زمینه مطالعه کنید و نظر خود را به من بگویید. این چیزی است که ما در تلاش برای ایجاد آن هستیم. در مورد من، می‌خواهم به دستیارم بگویم: جالب‌ترین و مرتبط‌ترین چیزهایی را که قبلاً نمی‌دانم به من نشان بده.»

بنابراین گوگل هوش مصنوعی را ابزار جدیدی می داند که می تواند با ارائه دانش جدید، توانایی های انسان را گسترش دهد. یک مثال خوب از آن AlphaGo است که بازیکنان Go آن را فرصتی برای ارتقای سطح خود می دانند. از این گذشته، اگر در برابر هوش مصنوعی که قبلاً از حداکثر رتبه در بازی فراتر رفته است، تمرین می کنید، این می تواند آن را به سطح جدیدی برساند.

هوش مصنوعیمدت طولانی است که در زندگی ما جا افتاده است. بیشتر اوقات، وقتی معمولاً از یک دستیار صوتی در تلفن هوشمند یا تشخیص خودکار تصویر در یک برنامه استفاده می کنیم، حتی به این موضوع فکر نمی کنیم. حتی جستجوی گوگل بدون یادگیری ماشینی، شاخه ای از هوش مصنوعی، کامل نمی شود.

حدود دو سال است که فناوری به نام RankBrain کار می کند که برای مرتب سازی هوشمند نتایج جستجو استفاده می کند. حدود 15 درصد از پرس و جوهای روزانه برای Google جدید هستند، به این معنی که قبلاً توسط هیچ کاربری فرموله نشده اند.

"هوش مصنوعی ما بدون دستورات انسانی عمل می کند"

استاد دیوید سیلور، برنامه نویس ارشد هوش مصنوعی
Google AlphaGo Zero

الگوریتم های RankBrain فرم های موجود را در فرم های ناشناخته جستجو می کنند پرس و جوهای جستجوو آنها را به مفاهیم مشابه معنایی پیوند دهید. در نهایت موتور جستجو باید به تنهایی یاد بگیرد و بتواند به سوالاتی که قبلا مطرح نشده است پاسخ مناسب بدهد.

گوگل از پردازنده‌های تانسور (TPU) که مخصوص این منظور طراحی شده‌اند در مراکز داده‌اش استفاده می‌کند.

واحدهای پردازش تانسور (TPU)

پیشرفت هوش مصنوعی گوگل چشمگیر است. یکی از دلایل این است که گوگل سخت افزار خاصی را توسعه داده است که شبکه های عصبی را بسیار موثرتر از CPU ها و GPU های استاندارد شتاب می دهد. به طور شگفت انگیزی، پردازنده های تانسور تا حدی از اجزای معمولی رایانه شخصی استفاده می کنند. آنها بر روی یک برد SATA پلاگین قرار دارند و از طریق PCI Express با سایر پردازنده های تانسور ارتباط برقرار می کنند.

ساختار پردازنده تانسور

جمع و ضرب سریع قدرت پردازشگر تانسور است. در ماژول مسئول این، با یک ماتریس به عنوان یک جزء مرکزی، محاسبات شبکه عصبی انجام می شود. حدود یک چهارم مساحت پردازنده را اشغال می کند. فضای باقی مانده برای ارائه سریع داده های ورودی استفاده می شود. اینها از طریق PCI Express و رم DDR3 عرضه می شوند. نتایج محاسبات از طریق PCI Express و رابط میزبان به سرور برگردانده می شود.

هوش مافوق بشری

پردازنده ها نام خود را از کتابخانه نرم افزار TensorFlow گرفته اند. هدف اصلی TPU تسریع الگوریتم های هوش مصنوعی است که بر کتابخانه های نرم افزار آزاد متکی هستند.

TPU ها در ابتدا به عنوان پلتفرم سخت افزاری AlphaGo محبوبیت پیدا کردند، هوش مصنوعی که بهترین بازیکنان جهان را در بازی آسیایی Go شکست داد. بر خلاف شطرنج، توسعه نرم افزار Go در سطح حرفه ای برای سال ها غیرممکن تلقی می شد.

توسعه بعدی، AlphaGo Zero، توانست به طور مستقل بازی را بر اساس قوانین داده شده به آن یاد بگیرد. در عرض سه روز به سطح حرفه ای رسید، در عرض سه هفته به نسخه قبلی AlphaGo رسید که آموزش آن هزینه زیادی داشت و میلیون ها بازی حرفه ای نیاز داشت. مشخص شد که هوش مصنوعی قبلاً مطالعه حرکات انسان را محدود می کرد. پس از شش هفته دیگر، AlphaGo Zero دیگر شکست ناپذیر نبود.

شتاب دهنده شبکه های عصبی

در مقایسه با پردازنده های معمولی، پردازنده های تانسور در استفاده از شبکه های عصبی مصنوعی تخصص دارند. آنها از بسیاری از توابع ریاضی شبکه ای تشکیل شده اند که مغز انسان را با سلول های عصبی و اتصالات آنها تقلید می کنند. مانند مغز ما، یک شبکه عصبی به ورودی مناسب نیاز دارد. آموزش، به عنوان مثال، در تشخیص گفتار، تشخیص تصویر، یا قوانین بازی "برو" انجام می شود.

یک شبکه عصبی مصنوعی شامل چندین لایه نورون است. هر نورون از مجموع وزنی مقادیر خروجی نورون های متصل در لایه قبلی استفاده می کند. بنچمارک صحیح کلید موفقیت در یادگیری ماشینی است، اما ابتدا باید انجام شود، که در عمل اغلب به معنای چندین عملیات ممیز شناور است.

در این رشته، GPU ها در واقع بهترین انتخاب هستند. برای مرتب‌سازی نتایج جستجو یا پیش‌بینی حرکات، شبکه عصبی دیگر نیازی به محاسبات نقطه شناور با دقت بالا ندارد. این فرآیند به تعداد بسیار زیادی عملیات ضرب و جمع اعداد صحیح نیاز دارد.

پردازنده های تانسور در مرکز محاسبات گوگل

گوگل از سال 2016 از TPU در مراکز داده خود استفاده می کند. برد معمولا چندین پردازنده در یک کلاستر دارد. آنها عمدتاً در بلوک های چهارتایی استفاده می شوند.

پردازشگر تانسور گوگل عمدتاً از یک واحد محاسباتی، ماتریسی از 256x256 واحد تشکیل شده است. بر روی اعداد صحیح هشت بیتی کار می کند، به قدرت پردازش 92 تریلیون عملیات در ثانیه دست می یابد و نتایج را در حافظه ذخیره می کند.

نمودار نشان می دهد که ماتریس تنها حدود یک چهارم منطقه پردازنده را اشغال می کند. اجزای باقیمانده مسئول ارائه مداوم داده های جدید به هسته ها هستند. پردازنده های تانسور برای خود فرمان صادر نمی کنند - آنها از سرور متصل از طریق PCI Express می آیند. نتایج نهایی نیز در پاسخ به همین روش منتقل می شود.

معیارهای مورد نیاز برای محاسبات شبکه عصبی توسط ماژول حافظه First-In/First-Out ارائه شده است. از آنجایی که برای یک برنامه خاص تغییرات کمی وجود دارد، اتصال از طریق رم DDR3 کافی است. نتایج میانی در یک درایو بافر 24 مگابایتی قرار می گیرند و به واحد محاسبات بازگردانده می شوند.

مصرف انرژی در مقایسه

مقایسه عملکرد پردازنده به ازای هر وات برق مصرفی، کارایی بیشتر پردازنده‌های تانسوری را نشان می‌دهد.

مسابقه CPU و GPU

پردازنده های تانسور با نرخ 225000 پیش بینی شبکه عصبی در ثانیه محاسبه می کنند. CPU و GPU نمی توانند با هم رقابت کنند.

45 برابر سریعتر از پردازنده های معمولی

اگرچه مجموعه دستورات CISC (کامپیوتر مجموعه دستورالعمل های پیچیده) یک پردازنده تانسوری می تواند دستورات پیچیده ای را انجام دهد، تنها حدود ده ها مورد از آنها وجود دارد. و بیشتر عملیات های مورد نیاز فقط به پنج دستورالعمل نیاز دارند، از جمله خواندن دستورالعمل ها، انجام ضرب ماتریس یا ارزیابی تابع فعال سازی.

با بهینه سازی محاسبات هوش مصنوعی، پردازنده های تانسور به طور قابل توجهی سریعتر از پردازنده های معمولی هستند (45 برابر) یا پردازنده های گرافیکی(17 بار). در عین حال، آنها با بهره وری انرژی بیشتری کار می کنند.

و گوگل تنها در ابتدای راه است: با کمک اقدامات سادهعملکرد پردازنده های تانسوری را می توان بیشتر افزایش داد. فقط نصب رم GDDR5 می تواند قدرت پردازش فعلی شما را سه برابر کند.

اگر همیشه فکر می‌کردید که در نورون‌های شبکه‌های عصبی چه می‌گذرد، گوگل بالاخره می‌تواند آن را برای شما توضیح دهد. این شرکت مجموعه ای از خدمات آزمایشی را منتشر کرده است که نشان می دهد هوش مصنوعی مدرن چه توانایی هایی دارد.

جالب ترین آنها Quick, Draw است! - بازی نوعی "تمساح" را پیشنهاد می کند. وظیفه شما این است که یک شی معین را در 20 ثانیه بکشید، به عنوان مثال یک هویج، یک دوچرخه، یک توپ، یک صورت و غیره. در همان زمان، برنامه باید تشخیص دهد که دقیقاً چه چیزی را سعی کرده اید به تصویر بکشید. در حالی که خطوط ناشیانه را با مکان نما ترسیم می کنید، شبکه عصبی تا زمانی که گزینه صحیح را تشخیص دهد، گزینه ها را بیرون می اندازد.

در عین حال، همانطور که شایسته یک شبکه عصبی است، بر اساس نقاشی های سایر کاربران یاد می گیرد. و هرچه AI تصاویر بیشتری ببیند، سریعتر می تواند پاسخ صحیح را پیدا کند. برای مثال، در این خط‌نوشته‌ها، شبکه عصبی یک کروکودیل را در چند ثانیه شناسایی کرد. می تونی؟

یکی دیگر از سرویس های سرگرم کننده جورجیو کم نام دارد. او می تواند اشیایی را که در دوربین می بیند شناسایی کند. در اینجا نتایج چندان چشمگیر نیستند و AI اغلب اشتباه است. با این حال، عدم دقت با ارائه جبران می شود. فرآیند شناسایی یک شی با موسیقی الکترونیکی بازیگوش همراه است و شبکه عصبی به طور ریتمیک گزینه های پاسخ به ضرب آهنگ را نشان می دهد. همه چیز بسیار ترسناک، اما جذاب به نظر می رسد.

به طور کلی، هوش مصنوعی هنوز کاملاً ابتدایی است و بدیهی است که قادر به ارائه یک برنامه مؤثر برای تسلط بر بشریت نیست. اما فعلا همین است.

می توانید تمام آزمایشات سرگرم کننده گوگل در زمینه ایجاد هوش مصنوعی را مشاهده کنید.