ХЗ. Хто знає, яким буде майбутнє - Тім О’Райлі
Компанії Facebook пощастило менше: їй не вдалося так узгодити устремління користувачів і рекламодавців.
Чому? Користувачі заходять у соціальні мережі не за фактами. Їм потрібен зв’язок із друзями, останні новини, розваги і найсвіжіші меми. Намагаючись задовольнити потреби аудиторії, Facebook обрала «функції пристосування» відповідно до аспектів, які на думку компанії є «значущими» для користувачів189. Так само як Google, Facebook послуговується різними сигналами, визначаючи, яка інформація в стрічці буде найбільш значущою для користувачів, але найголовнішим сигналом вважає «зацікавленість». Опція «Подобається», що незмінно супроводжує кожний пост у мережі, допомагає оцінити зацікавленість. Користувач сподівається на викид ендорфіну, коли друзі лайкають чи коментують контент, який він викладає. Крім того, Facebook зважає на кількість кліків (так само як Google), але найбільше цінуються кліки, які радше спонукають користувачів лишатися на сайтах і шукати схожу інформацію, ніж відвідувати сторінки одноразово.
Спершу стрічка новин на фейсбуку складалася лише з оновлень друзів, за якими користувач погодився стежити. Це була нейтральна платформа. Та розробники збагнули, що зацікавленості буде більше, якщо вгорі стрічки виставляти сторінки, які «подобаються» більшості користувачів, і посилання, на які найчастіше клікають. Іноді вони відображаються на фейсбуку знову і знову: те саме практикували забуті комерційні телеканали.
За часів зародження комерціалізації інтернету я побував на QVC — телеканалі, який слід вважати «дідусем» телевізійного шопінґу. Компанія прагнула створити онлайн-версію бізнесу. Три сцени, що обертаються, демонструють товари, а ведучі красномовно описують переваги і продають глядачам. Навпроти сцени — аналітик, що за величезним комп’ютером моніторить у реальному часі кількість дзвінків і продажів із кожного з кол-центрів компанії, дає сигнал переходити до наступного продукту, коли зацікавленість і продажі падають. Мені розповіли, що на співбесіді майбутні ведучі мають без упину вихваляти олівець протягом щонайменше 15-ти хвилин.
Саме так працює соціальна мережа, яка обрала «зацікавленість» своєю «функцією пристосування». Мільйони ведучих, які вихваляють бренд у режимі нон-стоп. Мільярди персоналізованих комерційних телеканалів «впарюють» контент.
І в Google, і в соціальних мережах невдовзі всі затанцювали під дудку алгоритмів: як сумлінні гравці, що дотримуються правил, так і шкідники. Вийшло, як у теорії філософа Маршалла Маклуена, що її отець Джон Калкін підсумував влучною тезою: «Ми конструюємо інструменти, а потім інструменти конструюють нас»190. Розробники обирають «функцію пристосування» алгоритмів, і ті функції визначають діяльність, бізнес-модель і користувачів компанії, а зрештою впливають на все суспільство. Про вади «функції пристосування» Facebook ми ще поговоримо в Розділі 10, а про фінансові ринки — у Розділі 11.
Від реактивних двигунів до ракет
Якщо сучасні великі масиви даних і статистичні методи нагадують про перехід від поршневих до реактивних двигунів, то машинне навчання можна порівняти з ракетними двигунами. Ракета долетить туди, куди не дістанеться апарат на реактивному двигуні, бо в її баках є окисник і пальне. Аналогія поганенька, зате відображає кардинальні зміни в роботі компаній (навіть таких, як Google) у зв’язку з машинним навчанням.
Ось як розповів про зміни в розробці програмного забезпечення Себастіан Трун, який керував першими заходами Google в галузі безпілотних автомобілів, а тепер є виконавчим директором платформи онлайн-навчання Udacity: «Раніше я писав програми, які чітко виконували те, що я їм наказував. Я продумував усі можливі відхилення і прописував їх у програмах. Тепер я заливаю дані і вчу програми виконувати те, що мені треба».
За старого підходу, програмісти Google визначали гіпотетичний сигнал для доцільніших результатів пошуку. Тоді писали алгоритм, тестували на добірці пошукових запитів і, в разі поліпшення результатів, запускали в систему. Якщо доцільніших результатів досягти не вдавалося, програмісти модифікували алгоритм і повторювали експеримент. Завдяки машинному навчанню програмісти, як і раніше, починають із гіпотези, але вручну не розробляють алгоритму для обробки даних. Вони готують набір даних для навчання, що відображають гіпотезу, потім заливають дані в програму з вихідною моделлю — математичною моделлю параметрів, які треба шукати серед даних. Цикл повторюється знову і знову: програма поступово підлаштовується під модель, модифікуючи гіпотезу за допомогою методу градієнтного спуску, доки не досягає ідеальної відповідності даним. Таким чином формується досконала модель, бо програма навчається в даних. Потім модель можна застосовувати до реальних даних, подібних до набору для навчання.
Янн Лекун — розробник «глибинного» методу машинного навчання, що спричинив справжній прорив, а нині очільник лабораторії Facebook із дослідження штучного інтелекту. На цікавій аналогії Лекун пояснив, як девелопери навчають моделі розпізнавати зображення:
Систему розпізнавання образів можна представити як чорну коробку, де з одного боку камера, зверху лампочки зеленого і червоного світла, а попереду багато ручок. Алгоритм навчання виставляє ручки так, що, коли перед камерою вигулькує пес, вмикається червоне світло, а коли автомобіль, — зелене. Машині показують пса і дають вказівки: яскраве червоне світло — нічого не робити; тьмяне червоне світло — відрегульовувати ручки так, щоб воно ставало яскравішим; зелене світло — відрегульовувати ручки так, щоб воно ставало тьмянішим. Потім показують автомобіль: відрегульовувати ручки так, щоб червоне світло тьмянішало, а зелене — яскравішало. Якщо показувати багато різних зображень з автівками і псами та щоразу підрегульовувати ручки, машина навчиться завжди давати правильну відповідь... Фішка в тому, щоб не крутити ручки, а лише розібратися, в який бік і наскільки кожна ручка повертатиметься самостійно. Для цього треба обчислити «градієнт», що для кожної ручки вказує, як змінюється світло при повороті. А тепер уявіть коробку з 500-ми мільйонами ручок, тисячею лампочок і 10-ма мільйонами зображень, що застосовуються для її навчання. Так працює типова система глибинного навчання191.
У глибинному навчанні є кілька рівнів розпізнавання. Перш ніж розпізнавати пса, треба навчитися розпізнавати форми. Перш ніж розпізнавати форми, треба розпізнавати обриси, тобто форму на тому чи іншому тлі. Послідовні етапи розпізнавання формують стиснену математичну модель, яка щоразу переходить на наступний рівень. Ключовий момент — правильне стиснення. Якщо стиснути дані надміру, модель не відображатиме повної картини того, що відбувається, а це призводить до