Розвиток штучного інтелекту призведе до зростання споживання електроенергії в американських центрах обробки даних; MIT та IBM розробляють інструмент для швидкого прогнозування енергоспоживання з метою забезпечення сталого функціонування штучного інтелекту. Цей інструмент дозволяє швидко оцінювати енергоспоживання, що допомагає операторам центрів обробки даних та розробникам алгоритмів.
Popsa використовує штучний інтелект та автоматизацію дизайну для створення персоналізованих фотоальбомів за лічені хвилини, покращуючи користувацький досвід та рівень задоволеності. Завдяки впровадженню моделей Amazon Bedrock та Amazon Nova у 2025 році було створено понад 5,5 мільйонів персоналізованих видань, що призвело до зростання рівня залученості та кількості покупок.
PageIndex revolutionizes document retrieval by using a tree-based index and LLMs for reasoning, outperforming vector-based systems like RAG. By indexing the Transformer paper without vectors, PageIndex showcases its precision and deep understanding capabilities, making it a game-changer for complex document analysis.
У новій статті Google представлено Vision Banana — уніфіковану модель, яка демонструє високу ефективність у виконанні різноманітних завдань у сфері комп'ютерного зору, зберігаючи при цьому можливості генерації зображень. Цей прорив ставить під сумнів традиційне розмежування між генеративними та дискримінативними моделями в галузі комп'ютерного зору.
Індійський студент-інформатик створив GitNexus для вдосконалення агентів кодування на основі штучного інтелекту. GitNexus заздалегідь обчислює всю структуру залежностей для точного аналізу коду.
MathNet, створений дослідниками з MIT, KAUST та HUMAIN, є найбільшим набором даних із математичних задач, що містять доведення, який охоплює 47 країн та 17 мов. Він представляє собою централізовану колекцію високоякісних задач та рішень із міжнародних математичних олімпіад, пропонуючи моделям штучного інтелекту та учням багатий ресурс для вивчення математичного мислення.
DeepSeek-AI представляє серію DeepSeek-V4 з інноваційними моделями MoE, що підтримують контекстні вікна розміром у мільйон токенів. Гібридна архітектура уваги та технологія Manifold-Constrained Hyper-Connections кардинально змінюють підхід до вирішення завдань із довгим контекстом.
Google DeepMind представляє Decoupled DiLoCo — розподілену архітектуру навчання, яка усуває вузькі місця, пов’язані із синхронізацією, та дозволяє здійснювати попереднє навчання великих мовних моделей у географічно віддалених дата-центрах. Decoupled DiLoCo зменшує вимоги до пропускної здатності між дата-центрами з 198 Гбіт/с до всього 0,84 Гбіт/с, що робить навчання в глобальному масштабі реал...
Досягнення в галузі штучного інтелекту в сфері охорони здоров’я дозволяють об’єднати розрізнені потоки даних, що сприяє прийняттю більш обґрунтованих рішень у сфері персоналізованої медицини. Мультимодальні біо-FM, такі як Latent-X1 та Evo 2, кардинально змінюють процес пошуку нових ліків та клінічних досліджень завдяки моделям штучного інтелекту, навченим на різноманітних біологічних наборах ...
Дослідники з Google Cloud AI, Університету Іллінойсу в Урбана-Шампейн та Єльського університету представляють ReasoningBank — фреймворк пам’яті, який аналізує причини успіху чи невдачі завдань, що виконуються агентами штучного інтелекту. Існуючі системи пам’яті агентів мають серйозні «сліпі зони», натомість ReasoningBank вибирає релевантні спогади для підвищення ефективності роботи.
TrendMicro вдосконалює сервіс чат-ботів на базі штучного інтелекту, додавши функцію «корпоративної пам’яті» в Amazon Bedrock, що працює на базі Amazon Neptune та Mem0. Така архітектура дозволяє чат-боту згадувати історію взаємодій, отримувати корпоративні знання та надавати індивідуальні відповіді, що покращує користувацький досвід.
Автор ділиться досвідом застосування набору даних про діабет у регресійній моделі на основі нейронної мережі, написаній на C#, яка дозволяє точно прогнозувати показники діабету. Завдяки нормалізації даних та налаштуванням нейронної мережі було отримано результати, порівнянні з результатами інших регресійних моделей.
Використання моделі NVIDIA Parakeet-TDT-0.6B-v3 у сервісі AWS Batch на інстанціях з прискоренням на базі графічного процесора дозволяє швидше та економічніше здійснювати транскрипцію аудіофайлів різними європейськими мовами. Архітектура «Token-and-Duration Transducer» цієї моделі в
Дослідники з Массачусетського технологічного інституту (MIT) розробили метод RLCR для підвищення точності оцінок впевненості моделей штучного інтелекту, що дозволяє зменшити кількість помилок на 90 % без втрати загальної точності. Ця техніка навчає моделі надавати відкалібровані оцінки впевненості, вирішуючи проблему надмірної впевненості в моделях міркування штучного інтелекту.
Навчання потужних моделей штучного інтелекту гальмується через брак спеціалізованих даних, але платформа Simula, розроблена Google та EPFL, пропонує прозоре та масштабоване рішення. Simula вирішує проблему генерації синтетичних даних, одночасно контролюючи якість, різноманітність та складність за допомогою таксономій, мета-підказок та подвійних критиків.