Експеримент із нейромережами: ШІ не зміг розв'язати всі надскладні задачі

Ілюстрація: magnific.com

Схоже, науковцям і математикам поки що зарано хвилюватися за свої робочі місця. Нове дослідження довело: навіть найсучасніший штучний інтелект (ШІ) досі не здатний обігнати людину в розв'язанні складних нестандартних задач. Про це в ефірі програми "Ранок Вдома" розповіли ведучі Дарія Кудімова та Денис Мінін.

Для експерименту чотирьом передовим системам, серед яких був і ChatGPT 5.5 Pro від OpenAI, дали 10 надскладних завдань дослідницького рівня. Цих кейсів не було в навчальних базах даних нейромереж, тож "підглянути" готову відповідь ШІ ніяк не міг, а весь процес проходив абсолютно автономно.

Правильність рішень згодом перевіряли незалежні експерти-математики. Результати виявилися показовими: найкраща модель впоралася лише з шістьма завданнями, при цьому професійні математики-люди раніше успішно розв'язали всі десять.

Хоча штучний інтелект ефективно генерує тексти чи код, у питаннях чистої логіки та винахідливості людський мозок залишається лідером.

"Системам штучного інтелекту ще доведеться пройти довгий шлях, перш ніж вони зможуть автономно виступати в ролі надійних дослідницьких асистентів, які перевіряють докази, та повноцінних вирішувачів задач для математиків", — зазначають організатори проєкту First Proof.

Більше новин "Ранку Вдома" та не тільки — читайте на нашому сайті:

Медіа-партнери
Прямий ефір