Вони покладуть край імітації голосу: Райчевич і Фатіч – автори платформи, яка розпізнає програмне мовлення

Ідея створення VirtuGuardians виникла через зростаюче занепокоєння з приводу зловживання голосами, створеними штучним інтелектом, особливо під час шахрайства з телефонними дзвінками, сказали вони в інтерв’ю «Vijesti».

Райчевич і Фатіч кажуть, що більшість громадян досі не усвідомлюють, що голоси, отримані таким чином, можуть бути легко використані зловживанням.

57290 переглядів 142 реакцій 12 коментар(ів)
Голоси, створені штучним інтелектом, стають все більш прогресивними, і їх стає все важче відрізнити від справжніх: Володимир Фатіч і Анджела Райчевич, фото: приватний архів
Голоси, створені штучним інтелектом, стають все більш прогресивними, і їх стає все важче відрізнити від справжніх: Володимир Фатіч і Анджела Райчевич, фото: приватний архів
Застереження: переклади здебільшого виконуються за допомогою перекладача штучного інтелекту і можуть бути не 100% точними

Італійський підприємець заплатив майже мільйон євро після того, як міністр оборони країни Гвідо Крозе попросив термінової фінансової допомоги для звільнення італійських журналістів, викрадених на Близькому Сході. Мабуть.

Нібито через те, що Крозе навіть не звертався з таким запитом, він і кілька італійських бізнесменів стали жертвами шахрайства, під час якого штучний інтелект (ШІ) використовувався для імітації голосу Крозе та, використовуючи його, переконував і переконував інших діяти за запитом і, в цьому випадку, сплатити певні суми грошей.

Ця ідея виникла через зростаюче занепокоєння з приводу неправильного використання голосів, створених ШІ, зокрема під час шахрайства з телефонними дзвінками. Ми стали свідками збільшення кількості випадків, коли зловмисники використовували глибокі підроблені голоси для маніпуляцій і шахрайства, будь то фінансове шахрайство, підроблені дані або навіть спроби порушити конфіденційність і репутацію. Ми зрозуміли, що існує потреба в інструменті, який міг би ідентифікувати такі зловживання та допомогти захистити користувачів.

У лютому агентство Reuters повідомило, що італійська поліція розкрила цю справу і що гроші, майже мільйон євро, перераховані відомим італійським підприємцем на рахунок в іноземному банку, були знайдені в Нідерландах.

Цей тип шахрайства відомий як «deepfake» і використовує передову технологію штучного інтелекту для створення переконливих підроблених аудіо- чи відеозаписів. Шахраї можуть імітувати голоси або обличчя реальних людей, щоб переконати жертв вжити певних дій, наприклад переказати гроші або розкрити конфіденційну інформацію.

Саме це надихнуло Анджелу Райчевич, студентку третього курсу факультету електротехніки Університету Чорногорії, на розробку VirtuGuardians, платформи, яка використовує модель ШІ, яка аналізує акустичні характеристики голосу та розпізнає шаблони, типові для згенерованих голосів. Ідея була визнана найкращою на першій преінкубаційній стартап-програмі SkillsUp, яку торік організували Науково-технологічний парк Чорногорії та Чорногорський телеком. Всього свої проекти представили сім команд. Разом з Анджелою Райчевич над розробкою VirtuGuardians також працює Володимир Фатіч, який навчається на докторантурі на факультеті архітектури Університету Чорногорії.

Фатич і Райчевич
Фатич і РайчевичФото: Борис Пейович

В інтерв’ю «Vijesti» Райчевич пояснює, як у них виникла ідея VirtuGuardians, як працює система та як програма SkillsUp допомогла їм розвинути проект.

"Ідея виникла через зростаюче занепокоєння з приводу зловживання голосами, створеними штучним інтелектом, особливо під час шахрайства з телефонними дзвінками. Ми стали свідками збільшення кількості випадків, коли зловмисники використовували глибокі підроблені голоси для маніпуляцій і шахрайства, будь то фінансове шахрайство, підроблені дані або навіть спроби порушити конфіденційність і репутацію. Ми зрозуміли, що існує потреба в інструменті, який міг би ідентифікувати такі зловживання та допомогти захистити користувачів", - сказала вона.

На запитання, як працює ця система, яка розпізнає створені програмним забезпеченням голоси, Райчевич сказав, що VirtuGuardians використовує модель AI, яка аналізує акустичні характеристики голосу та розпізнає шаблони, типові для створених голосів.

Райчевича
РайчевичаФото: Борис Пейович

"Ми покладаємося на глибоке навчання та аналіз спектрограм, щоб виявити порушення, які людське вухо не може легко виявити. Потім система порівнює зразки з базою даних відомих голосів, згенерованих штучним інтелектом, і оцінює ймовірність того, що голос є справжнім або згенерованим".

Команда авторів також пояснює, що розробка цього рішення супроводжується проблемами, найбільшою з яких є те, що голоси, згенеровані штучним інтелектом, стають все більш просунутими, і їх стає все складніше відрізнити від реальних.

Ось чому, каже Райчевич, модель потрібно постійно вдосконалювати, щоб вона могла розпізнавати нові методи генерації голосів.

«Крім того, баланс між точністю та швидкістю виявлення є ключовим — система має бути достатньо швидкою, щоб працювати в режимі реального часу, але також достатньо точною, щоб уникнути помилкових спрацьовувань і негативів», — сказала вона.

Стосовно того, наскільки точною технологія наразі відрізняє справжні голоси від фальшивих, Райчевич каже, що поточна точність залежить від якості зразка.

«Але в наших тестах система досягає точності понад 90 відсотків. Однак у міру розвитку технології deepfake нам потрібно постійно оновлювати алгоритми та навчати їх на нових даних, щоб підтримувати високу точність».

Програма SkillsUp, яку пройшли Райчевич і Фатіч і в рамках якої було розроблено VirtuGuardians, вперше була організована минулого року. Програма, як раніше повідомляв Науково-технологічний парк, покликана заохочувати підприємницький дух та розвивати інноваційні ідеї молодих талантів. Програма SkillsUP включала інтерактивні лекції, майстер-класи та менторство з ключових тем підприємництва. Учасники мали можливість навчатися у таких лекторів, як Володимир Вуліч, Стіпан Удовічіч, Ясна Пейович, Срна Судар, Александар Яничич, Данило Нікович, Марко Любенович і Радівое Дробняк. Учасниками програми були ментори Мар’ян Попович, менеджер служби мультимедійного контенту в Crnogorski Telekom, Іван Шоч, засновник Five Group, Нікола Мічуновіч, Entrepreneural Nest UDG, Урош Булатович та Ігор Горанович з Союзу молодих підприємців Чорногорії та Нікша Булатович з компанії Adriatic Bridge Partners.

Фатич
ФатичФото: Борис Пейович

"Програма SkillsUp забезпечила нам структурований підхід до розробки ідей, а також наставництво від експертів, які допомогли нам краще визначити бізнес-модель і технічні аспекти проекту. Ми також мали можливість протестувати нашу ідею на семінарах і отримати цінні відгуки", - говорить Райчевич.

Що стосується наставництва, вона сказала, що вони навчилися від наставників, наскільки важливо чітко повідомляти про цінність свого продукту, як ідентифікувати ключових користувачів і як справлятися з технічними та бізнес-проблемами.

Крім того, додає він, було корисно те, що вони змогли обмінятися досвідом з іншими командами. Це, за її словами, допомогло їм побачити різні підходи до інновацій та вирішення проблем.

Говорячи про плани на майбутнє, автори VirutGuardians кажуть, що вони продовжуватимуть удосконалювати модель і тестувати її в реальних сценаріях, але також досліджуватимуть можливості інтеграції з існуючими системами зв’язку та безпеки.

Наступні кроки, за словами Райчевича, включають удосконалення моделі шляхом глибшого аналізу та збору нових даних, інтеграцію з API для легшого впровадження в різні системи та роботу над підвищенням точності виявлення. Вони також вивчають можливості фінансування для розширення команди та прискорення розробки, а також розглядають моделі передплати або ліцензування для компаній, які хочуть використовувати їхні технології.

Вони вже контактують з певними установами та компаніями, які можуть отримати вигоду від їхньої системи, такими як банки, кол-центри та служби кібербезпеки.

«Ми вважаємо, що співпраця з державним сектором може стати ключовою для регулювання та боротьби зі зловживанням технологією deepfake», — сказав Райчевич.

Райчевич каже, що у світі є проекти, схожі на VirtuGuardians, але більшість з них зосереджені на розпізнаванні відео підробок, а вони з Фатічем спеціалізуються на аналізі голосу.

«Наша система розроблена так, щоб її було легко інтегрувати та працювати в режимі реального часу, що робить її придатною для широкого застосування в різних секторах», – сказав співрозмовник «Вієсті».

Більшість не усвідомлює небезпеки

На запитання, яким він бачить майбутнє ШІ у сфері кібербезпеки, Райчевич каже, що ШІ «гратиме ключову роль у виявленні та запобіганні кіберзагрозам, але в той же час зловмисники також використовуватимуть ШІ для більш витонченого шахрайства».

Тому, додає він, будуть розроблятися все більш досконалі системи безпеки на основі машинного навчання.

Він не налаштований оптимістично, коли справа доходить до усвідомлення небезпеки технології deepfake.

«Більшість людей досі не усвідомлюють, наскільки переконливі глибокі фейкові голоси та як легко ними можна зловживати. Освіта та розробка інструментів, таких як VirtuGuardians, є ключовими для підвищення обізнаності та захисту користувачів».

Бонусне відео: