Е-битка за истината
Д-р Преслав Наков от Катар показа как компютрите научават естествения език и ни помагат да се ориентираме в морето от новини
Особено перспективна област през последните години са дълбоките невронни мрежи, при които обработката на информацията се извършва на няколко нива – задавайки си различни въпроси, частите на изкуствения мозък допълват общата картина на това, което търсим.
На върха на езика
Именно това е целта, на която посвещават сериозни изследвания напоследък той и колегите му. Те създават софтуер, който може успешно да изпълнява тази отколешна човешка мечта: да търси истината.
Областта на науката, с която Преслав се занимава, е компютърната лингвистика. „Нейната задача е да научим компютрите да разбират човешки език“, обяснява той. С колегите му се опитват да създадат дълбока невронна мрежа, която да улавя истинските новини независимо от езика, на който са публикувани, и от всякакви субективни обстоятелства. А пътят към създаването й минава през много въпроси.
„Истинският проблем идва, когато започнат да се манипулират хората. Забележете, това не са false, а fake news. Не е проблемът, че не са истински, а че са се превърнали в политическо оръжие“, казва той. „Техният механизъм са социалните медии, защото там потребителят може да бъде много лесно профилиран. На базата на данните от тях се решава как да се подходи и се прави стратегия. Социалните мрежи позволяват микротаргетиране, например ако е жител на малък американски град в определен щат, в определена възрастова група, непрекъснато ще му се появяват новини, свързани с ограничаването на достъпа до оръжие, защото към това е чувствителен, а той и не подозира. Така или иначе, фалшивите новини вече дават сериозни отражения в реалния свят. Всички сме чували за съмненията, свързани с тях и резултатите от американските избори и гласуването за Брекзит, но случаите са много повече. Голямата криза с преследването на мюсюлманското малцинство рохинга в Мианмар започна именно с фалшиви новини в социалните мрежи. Вече година страната, в която живея – Катар, е подложена на икономическа блокада и всичко започна отново по същия начин. Хакери атакуваха националната информационна агенция, сложиха фалшива новина, от която започна огромен дипломатически конфликт. Тези неща са сериозни и могат да имат огромно значение в реалния живот – в политиката и икономиката“, казва изследователят.
„Според науката техниките на пропаганда са повече от 60. Когато се стигне до неудобен въпрос, се бяга в далечна тема или пък се повтарят цитати от миналото... Те са познати много отдавна и въпреки това не спират да работят. Гьобелс казва: „Пропагандата става неефективна тогава, когато хората знаят за нея“. Именно това е целта и сърцето на нашия проект“, разказва изследователят.
Дума по дума
В момента онлайн има около 200 мащабни организации, които се борят с фалшивите новини, проверявайки информацията. най-популярният сайт е factcheck.org, там са проверени около 10 000 твърдения. И все пак: от една страна, броят е нищожен на фона на ежедневния новинарски поток, от друга: понякога проверката на даден факт може да отнеме много, много време, което ще му е достатъчно да обиколи планетата. Ако човек се довери напълно на дадена организация, която да проверява фактите, това пък крие рисковете от нови манипулации.
Ето тук на помощ идва това, от което очакваме най-силно да промени живота ни в следващите години: изкуственият интелект и дълбоките невронни мрежи.
Първата задача на невронната мрежа: да отсее какво точно трябва да бъде проверено. Задачата съвсем не е рутинна. Изследователите вземат като изходна точка последния дебат между Тръмп и Клинтън дни преди изборите. Спорът е анализиран много подробно от 9-те най-популярни сайта за проверяване на достоверността на фактите, където професионални журналисти са били изправени пред същото предизвикателство – да отделят ключовите твърдения, които да бъдат проверени. Показателно е, че измежду около 4000 изречения в спора няма нито едно, което да е отличено като ключово и в деветте сайта, само 6 са отбелязани на поне 8 от местата. Решенията на деветте екипа са вкарани в невронната мрежа след подробен анализ. Тя е научена да забелязва не само съдържанието на изречението, но и дължината му, емоцията, която съдържат думите му. Отчита се какво е глаголното време, дали става дума за реакция на твърдение на опонента, съдържа ли собствено име, носи ли позиция. Извън структурата на диалога невронната мрежа е обучена и да търси вътрешни противоречия в думите на единия участник в разговора, има ли прилика с вече проверени твърдения, каква е реакцията на публиката в залата. Всичко това са фактори, които подсъзнателно анализираме и ние, слушайки който и да било събеседник, макар и да не е възможно да ги анализираме в такава пълнота.
ГЬОБЕЛС КАЗВА: „ПРОПАГАНДАТА СТАВА НЕЕФЕКТИВНА, КОГАТО ХОРАТА ЗНАЯТ ЗА НЕЯ“.
След като целият този пъстър спектър от информация е вече в невронната мрежа, изследователите проверяват как се справя тя със следващите текстове. И се оказва, че успехът е налице – в огромна част от случаите софтуерът избира като ключови едни и същи твърдения с много от водещите сайтове, където същата работа е свършена от хора. Основното предимство на невронната мрежа е, че тя се самообучава – на базата на успехите си в обработката на даден текст и допуснатите грешки тя бива подобрявана така, че да не ги повтаря при следващия текст. Същевременно тя анализира и работата на 9-те сайта за проверка на факти – какво отличава всеки от тях в подхода му към избора на изречения, което пък дава допълнителна информация – например за пристрастията на журналистите, правили анализа.
Дълбоки води
По този начин дълбоката невронна мрежа решава едновременно няколко задачи, които са свързани помежду си и по този начин си влияят, допълват се и си помагат една на друга. Нещо повече, системата е разработвана едновременно да работи на английски и арабски, така че успехът й да не зависи от езика, на който е текстът за проверка“, разказва Преслав Наков.
ЕДНО ОТ ГОЛЕМИТЕ ПРЕДИЗВИКАТЕЛСТВА Е ДА СЕ ОТЛИЧАТ МНЕНИЯТА ОТ ТВЪРДЕНИЯТА.
„Постепенно и аз стигнах до извода, че най-важно е да се концентрираме върху източника. Ако искам да видя дали едно твърдение е вярно, първата стъпка е да проверя кои медии имат връзка с него – ако го подкрепя надеждна медия, голям е шансът дори да е провокативно, то да е вярно. Ако зад него стои медия, която вече е натрупала много грешки, това е сигнал в обратната посока. Но това е само едната страна на нещата, не е достатъчно да разделим медиите на „добри“ и „лоши“ и с това всичко да приключи. Например важно е да знаем дали медията е лява, или дясна, дали има някаква връзка – позитивна или негативна, с източниците или с обектите на информацията. Медиите могат да бъдат анализирани от гледна точка на пристрастие – ако например няколко месеца пишат в определена посока, или пропаганда – пристрастие с цел. Например ако пише изцяло отрицателно за световното по футбол в Катар, добре е потребителят да познава контекста, четейки дадена новина. Понякога дори не е толкова важно дали медията е фалшива, а каква е пристрастността, защото всички ние си създаваме отношения към теми, личности, въпроси“, допълва Преслав.
ГОЛЯМА ЧАСТ ОТ СТАТИИТЕ, КОИТО ЧЕТЕМ ДНЕС, СА АВТОМАТИЧНО ГЕНЕРИРАНИ ОТ КОМПЮТЪР.
Противно на очакванията, става ясно, че анализирането на коментарите към една новина не помага особено за това да се провери нейната достоверност. мащабно изследване е показало, че ако се анализира обсъждането на една фалшива новина, 3/4 от коментарите са неутрални, някои потвърждават твърдението в нея, други влизат в дискусия, но само 2% казват, че то е фалшиво.
Журналист с процесор
И все пак: защо трябва да даваме още една ключова отговорност – търсенето на истината, в ръцете на компютрите?
Някои от причините вече със сигурност са ви ясни, но може би най-важната оставихме за накрая. Защото може да не подозираме, но вече сме дали на машините другата, много по-голяма половина от работата: създаването на новини.
„Генерирането на изображения, видео и звук, при които действителността не може да бъде различена от манипулацията, отдавна не е проблем за съвременните компютърни системи, там каузата скоро ще бъде безвъзвратно изгубена – единствено остава битката за текста“, казва Преслав. Можете да видите онлайн клипове, в които по съвършен начин е симулирано, че даден политик казва неща, за които не би си и помислил. За манипулирането на снимки дори няма нужда да споменаваме.
Chat GPT: Задавали са ми въпроса „Как да накарам магарето си да говори?“
Вчера тръгна и нова версия на българския GPT, прочетете интервю с двамата братя
Защо самолетите избягват да летят над Тибет?
Турбуленцията е мощна заради планините, а и няма зони за аварийно кацане
Приложение за телефон помага да тренирате за осъзнати сънища
Подходът „Направи си сам“ е за развлечение, но и за самообучение
Талибански закон забранява на жените да говорят на улицата
„Когато зряла жена напусне дома си по необходимост, тя е длъжна да скрие гласа, лицето и тялото си“, пише в разпоредбите
Портрет, нарисуван от хуманоиден робот, продаден на търг за 1 млн. долара
27 оферти е имало в Sotheby's за картината на Ай-Да
Изкуственият интелект ще унищожи творческото писане
След 20 г. няма да има много хора, които могат да пишат, прогнозира компютърният експерт Пол Греъм
Най-големият крокодил в плен в света умря на 110 години
Някои източници твърдят, че Касий се е излюпил преди повече от 120 г.
Тийнейджър се самоуби след чат със създадена от изкуствен интелект героиня
Родителите съдят собственика на чатбота
Обещаните от Илон Мъск къщи за по 10 000 долара вече са на пазара
Производителите смятат да решат жилищната криза и да помогнат на бедните да имат покрив над главите
Истината за Хелоуин
Келтите вярвали, че тази нощ е границата между живота и смъртта. Тя е толкова тънка, че мъртвите бродят по земята.
Потвърдено: смяната на часовниците увеличава броя на ПТП
Автомобилната асоциация на UK и Tesco Bank с нови изследвания за влиянието на промяната през есента върху шофьорите
В света има над 300 различни езика на знаците
На какъв език мислят хората, които никога не са чували човешка реч?
Виена държи първото място в класацията за любимо европейско направление
Американците слагат Токио, Сингапур, Сидни и Кейптаун начело на предпочитанията си
„Луната на ловеца“ е с 30% по-ярка и най-голямата тази година
Снимайте красавицата и я споделете в коментарите към статията във фейсбук
Калифорния легализира кафенета за канабис
Досега черният пазар задушаваше лицензираните търговци на дребно