Стрічка новин про штучний інтелект і машинне навчання

Головні новини та публікації щодня! Будьте на крок попереду: дізнавайтеся першими про нові ідеї, тренди та інновації у сфері технологій

Оптимізація перетворення тексту в SQL за допомогою Amazon Nova Micro та Bedrock

Завдання з перетворення тексту в SQL вирішуються за допомогою моделей Amazon Bedrock та Nova Micro, що забезпечують економічно ефективні індивідуальні рішення. Точне налаштування адаптерів LoRA під конкретні діалекти SQL гарантує високу продуктивність без постійних витрат на хостинг.

Опанування процесів навчання та розгортання великих мовних моделей

Навчання сучасної великої мовної моделі передбачає попереднє навчання загальним мовним шаблонам, а потім — контрольоване точне налаштування для виконання конкретних завдань. Такі методи, як LoRA та RLHF, дозволяють вдосконалити модель, що дає змогу впроваджувати її в реальні системи для досягнення оптимальної продуктивності та забезпечення максимальної користі.

Оптимізація систем візуалізації за допомогою проектування на основі аналізу даних

Кодер перетворює зображення об’єктів на зображення без шуму, кількісно оцінюючи, наскільки точно вимірювання дозволяють розрізнити об’єкти. Штучний інтелект здатний виокремлювати корисну інформацію навіть у тих випадках, коли вона закодована у формі, яку людина не може розтлумачити, оптимізуючи системи візуалізації з урахуванням їхнього інформаційного наповнення.

Революція в моделях згортання білків

PLAID — модель, що генерує послідовності та структури білків, — відображає роль штучного інтелекту в біології. Модель вирішує такі завдання, як моделювання всіх атомів та врахування специфіки організмів, маючи на меті ефективне створення корисних білків.

Захист запитів: StruQ та SecAlign

Останні досягнення у сфері великих мовних моделей (LLM) відкривають можливості для створення цікавих інтегрованих додатків, однак атаки типу «prompt injection» становлять серйозну загрозу. StruQ та SecAlign — це запропоновані засоби захисту, покликані зменшити ризики, пов’язані з атаками «prompt injection» у системах LLM, таких як Google Docs та ChatGPT.

Дискримінація за діалектом: виявлення мовних упереджень у ChatGPT

ChatGPT демонструє упереджене ставлення до «нестандартних» різновидів англійської мови, а його відповіді містять стереотипи та зверхність. У рамках дослідження GPT-3.5 Turbo та GPT-4 отримали запити з 10 різновидами англійської мови, що виявило збереження рис стандартної американської англійської.

Розкриття можливостей взаємодії з великими мовними моделями

Розуміння складних систем машинного навчання, таких як великі мовні моделі (LLM), має вирішальне значення для штучного інтелекту. Нові алгоритми, такі як SPEX і ProxySPEX, покликані виявляти критичні взаємодії у великих масштабах шляхом вимірювання впливу за допомогою абляції, виділяючи фактори, що впливають на прийняття рішень, із найменшими можливими відхиленнями.

Робочі процеси на основі штучного інтелекту від Google в Chrome, що запускаються одним кліком

Google впроваджує функцію Skills in Chrome у рамках Gemini, що дозволяє користувачам зберігати запити до штучного інтелекту як робочі процеси, які можна використовувати повторно. Ця функція спрощує виконання завдань у декількох вкладках, даючи уявлення про майбутнє агентів штучного інтелекту на рівні браузера.

Parcae: вдосконалення мовних моделей на основі циклів в Каліфорнійському університеті в Сан-Дієго

Дослідники з Каліфорнійського університету в Сан-Дієго та компанії Together AI представляють Parcae — архітектуру трансформера з циклічною структурою, яка демонструє кращі результати, ніж попередні моделі, при використанні тих самих параметрів і навчальних даних. Конструкція Parcae дозволяє вирішити проблему обмеженості пам’яті та забезпечує більшу обчислювальну потужність за один прохід, усув...

Оприлюднено вікові обмеження для спін-офів «Пітта» та «Гри престолів»

Інструмент на основі штучного інтелекту допомагає Британському раді з класифікації фільмів та телепрограм (BBFC) класифікувати британські серіали HBO Max, такі як «Пітт» та спін-оф «Гри престолів», виокремлюючи суперечливі сцени для подальшого розгляду фахівцями. Цей інструмент допомагає виявляти порушення норм, зокрема сцени насильства, оголення та нецензурну лексику.

Вартість токена: ключовий показник загальної вартості володіння (TCO) у сфері штучного інтелекту

Центри обробки даних перетворилися на фабрики токенів штучного інтелекту, зосередившись на вартості одного токена, а не на суто обчислювальній потужності. NVIDIA пропонує найнижчу в галузі вартість одного токена, що дозволяє максимізувати дохід і прибуток.

Прискорення інференції великих мовних моделей за допомогою спекулятивного декодування на AWS Trainium

Розгортання моделей Qwen3 із використанням vLLM, Kubernetes та чіпів AWS AI дозволяє знизити вартість одного токена та підвищити пропускну здатність. Спекулятивне декодування на AWS Trainium прискорює генерацію токенів у 3 рази, зменшуючи затримку та витрати на інференцію для додатків штучного інтелекту.

Незадовільні результати: регресія на основі дерева рішень у C# на наборі даних про діабет

Розробник застосував набір даних про діабет до регресійної моделі на основі дерева рішень, написаної на C#, що виявило низьку точність прогнозування через надмірне перенавчання. Нормалізовані дані та параметри моделі стали ключовими факторами для досягнення результатів, порівнянних із результатами, отриманими за допомогою DecisionTreeRegressor з бібліотеки scikit.