Стискаємо LLM в 10 разів без втрати продуктивності. Такі методи, як квантування, обрізання та дистиляція знань, роблять потужні моделі ML більш доступними.
2024: Поява агентів нового покоління, таких як MultiOn, LangGraph та LlamaIndex Workflows. Агенти другого покоління пропонують структуровані шляхи для більш потужних можливостей, відходячи від невдалих агентів ReAct.
Митці досліджують потенціал та ризики штучного інтелекту. Кейт Бланшетт жартує про секс-роботів у фейковому зверненні до ЄС 2023 року.
GPT-4o і LATS об'єднуються, щоб покращити процес прийняття рішень на рівні LLM, революціонізуючи розв'язання проблем завдяки розширеним можливостям міркувань. Алгоритми мета-генерації збільшують обчислювальні ресурси під час виведення, імітуючи когнітивні процеси вищого рівня для покращення продуктивності моделі.
Найкращі LLM протестовані на структурований випуск: Google Gemini Pro, Anthropic Claude, OpenAI GPT. OpenAI лідирує завдяки прямій інтеграції для JSON. Anthropic вимагає «виклику інструментів», а Google Gemini є громіздким.
Водопостачальна компанія на південному сході Англії вважає запропонований план скорочень «неінвестиційним». Polestar змінює генерального директора на колишнього боса Opel, наголошуючи на глобальній присутності та баченні електромобілів.
Впровадження штучного інтелекту, як-от Amazon Q Developer, може підвищити продуктивність розробників на 30%. Amazon Q Business покращує роботу підприємства за допомогою генеративного ШІ.
Microsoft подарувала проект Mono WineHQ, заохочуючи міграцію на відкритий фреймворк .NET. Mono, створений Мігелем де Ікаса, був першопрохідцем для .NET на різних операційних системах.
Стармер натякає на «болючі» бюджетні скорочення, порівнюючи їх з провальною політикою Осборна. Закликає до Beveridge Mark 2, щоб відновити надію після 14 років розпачу.
Дослідники з Массачусетського технологічного інституту розробили алгоритм для розв'язання нелінійних параболічних рівнянь у комп'ютерній графіці. Новий підхід спрощує складні задачі до трьох кроків для кращого аналізу форми.
Набір інструментів NVIDIA RTX AI Toolkit дозволяє розробникам точно налаштовувати моделі для підвищення продуктивності за допомогою LoRA, збільшуючи швидкість до 6 разів. Налаштування LLM за допомогою адаптерів LoRA дозволяє створювати індивідуальні результати, наприклад, генерувати діалоги в певних стилях або голосами одночасно для різних додатків.
RAG поєднує в собі моделі пошуку та генерації для систем контролю якості. Автоматизуйте наскрізне розгортання RAG за допомогою AWS CDK та Amazon Bedrock.
AWS DeepRacer: Навчіться долати розрив між sim2real та реальністю, опанувавши фізичний трек. Зрозумійте, як датчик камери автомобіля використовує зображення у відтінках сірого для навігації на основі значень пікселів.
Nvidia, третя за вартістю компанія, збільшила дохід до $30,04 млрд завдяки зростанню попиту на штучний інтелект. Незважаючи на перевищення очікувань, акції компанії впали на 3% в позаурочний час.
Google і Тель-Авівський університет представляють GameNGen - модель штучного інтелекту, що імітує гру Doom, використовуючи техніку стабільної дифузії. Нейромережева система може революціонізувати синтез відеоігор у реальному часі, прогнозуючи та генеруючи графіку «на льоту».