atpv

Навчальні матеріали з автоматизації технологічних процесів та виробництв, розроблені спільнотою

     
  Зміст 1 Машинне навчання —>

Передмова

Нинішній період розвитку штучного інтелекту розпочався, коли Крижевський та ін. [2012] показали, що штучна нейронна мережа (artificial neural network) з простою структурою, яка була відома більше двадцяти років [LeCun et al., 1989], може перевершити складні найсучасніші методи розпізнавання зображень з величезним відривом, просто будучи у сто разів більшим і навчаючись на так само збільшеному наборі даних.

Цей прорив став можливим завдяки графічним процесорам (Graphical Processing Units, GPU), високопаралельним обчислювальним пристроям масового ринку, розробленим для синтезу зображень у реальному часі та перепрофільованим для штучних нейронних мереж.

Відтоді під загальним терміном “глибоке навчання” (deep learning) інновації в структурах цих мереж, стратегіях їхнього тренування та спеціальному апаратному забезпеченні дозволили експоненціально збільшити як їхній розмір, так і кількість навчальних даних, які вони використовують [Севілья та ін., 2022]. Це призвело до хвилі успішних застосувань у технічних областях, від комп’ютерного зору та робототехніки до обробки розмови та природної мови.

Хоча основну частину глибокого навчання не особливо важко зрозуміти, воно поєднує в собі різноманітні компоненти, що ускладнює його вивчення. Воно охоплює кілька галузей математики, таких як обчислення, ймовірності, оптимізація, лінійна алгебра та обробка сигналів, а також глибоко закріплене у інформатиці, програмуванні, алгоритміці та високопродуктивних обчисленнях.

Замість того, щоб бути вичерпною, ця маленька книжка обмежується бекграундом та інструментами, що необхідні для розуміння кількох важливих моделей.

Якщо ви отримали цю книгу НЕ з офіційної URL-адреси https://fleuret.org/public/lbdl.pdf, зробіть це, щоб я міг оцінити кількість читачів.

Франсуа Флере (François Fleuret), 21 травня 2023 р

en