Лидерът в социалните мрежи и съвременните технологии Meta направи нов пробив в развитието на изкуствения интелект, като създаде нов модел AI, способен да превежда на 204 различни езика. Компанията твърди, че моделът поддържа повече езици от всички водещи софтуери на пазара и осигурява преводи с още по-високо качество.
Внедряването на AI и машинното обучение се оказа изключително успешно в много различни области досега. Способността да учи от предварително зададени данни и от собствения си опит беше доказана от AI роботи, които успяха да победят професионални играчи в игри като покер, въпреки разнообразието от покер ръце и непълната информация за картите на опонентите, или дори бридж, където е необходимо известно ниво на комуникация и сътрудничество между играчите. Подобни експерименти доказаха, че изкуственият интелект може да се развива и самоусъвършенства, и със сигурност е способен на много повече.
Моделът на Metа носи името No Language Left Behind и поддържа повече езици от Google Translate, който в момента работи със 133, и Microsoft Translator, който обслужва 110. Изкуственият интелект борави с малки и рядко срещани езици, които се говорят от едва няколко стотин хиляди души. Въпреки това, независимо от името си, обхваща само малка част от близо 7000-те езика и диалекти, които се говорят по света, и все още не съответства на Wikipedia, в която има статии на 327 езика. Все пак от Meta обещават, че ще продължат да обогатяват библиотеката от езици.
No Language Left Behind е разработен с помощта на новия AI суперкомпютър на Meta, наречен AI Research SuperCluster (RSC). Компютърът вече е в процес на работа, но все още има накъде да се развива и когато бъде завършен, ще се състои от цели 16 000 процесора. Според Meta това ще бъде най-бързият суперкомпютър, оптимизиран за изкуствен интелект в света, който ще може да извършва 5 квинтилиона (5 с 18 нули) операции в секунда.
Да се създаде качествен превод е изключително трудна задача, особено когато става дума за машинен превод, където дори малка грешка може да доведе до катастрофални резултати.
За да оцени качеството на новия модел, Meta създаде набор от тестови данни, състоящ се от 3001 двойки изречения за всеки език, обхванат от модела, всяка преведена от английски на целевия език от професионални преводачи, за които даденият език е майчин. Впоследствие, всяко от изреченията се подлага и на машинен превод, за да се съпостави резултата от професионалиста и от машината.
След края на проведените тестове, компанията твърди, че No Language Left Behind е с 44% по-добър от еквивалентния изследователски модел DeltaLM на Microsoft, и малко по-добър от Google Translate.
Според специалистите в Мета, въпреки че AI моделът може да работи на по-малко усъвършенстван хардуер, мощността на суперкомпютъра е жизненоважна за бързото обучение и тестване на итерации на модела. Завършеният модел обаче все още изисква повече компютърна мощност, отколкото повечето хора имат на своите настолни компютри. Поради тази причина Meta пусна и по-малък модел, който да бъде по-малко взискателен към устройството и да може да функционира и на по-слаби компютри.
Пълният модел No Language Left Behind се състои от 54 милиарда параметъра, което означава, че е много по-малък от сходни модели с изкуствен интелект за натурален превод като например модела Megatron-Turing Natural Language Generation (MT-NLG), който разполага с близо 10 пъти повече параметри.
Meta възнамерява да използва No Language Left Behind в собствените си приложения, от Facebook и Instagram до разработване на VR и AR. Машинният превод не само позволява на Meta да разбира по-добре своите потребители (и по този начин да може да подобрява алгоритмите на рекламите, които генерират основен приход за компанията), но също така може да бъде основата за развиване на нови иновативни проекти. Едновременно с това моделът на изкуствения интелект е open source, или с отворен код, което на практика означава, че ще може да се използва от всеки. Трети страни също могат да предоставят подобрения на кода, които могат да бъдат интегрирани в проекта. Meta също така предлага безвъзмездни средства за учените, които искат да развиват подобни проекти, но нямат възможности за финансиране.
От съзвездието Банкя