Великі мовні моделі, такі як GPT та BERT, покладаються на архітектуру трансформатора та механізм самоуваги для створення контекстуально багатих вбудовувань, що революціонізувало НЛП. Статичні вставки, такі як word2vec, не здатні вловити контекстну інформацію, що підкреслює важливість динамічних вставок у мовних моделях.
OpenAI зіткнувся з негативною реакцією Скарлетт Йоханссон через новий чат-бот Sky, схожий на її героїню у фільмі «Вона». Глобальний саміт зі штучного інтелекту в Південній Кореї та звіт Інституту Алана Тьюринга про вплив АІ на вибори. Алекс Херн з Guardian обговорює останні розробки в галузі АІ з Мадлен Фінлі на BBC News.
Мультимодальні моделі, такі як Claude3 і GPT-4V, інтегрують текст і зображення для кращого розуміння. Точне налаштування LLaVA на конкретних даних підвищує продуктивність у різних галузях.
Колишній член правління OpenAI висловлює здивування з приводу публічного релізу ChatGPT у Twitter, який змістив фокус компанії. Також обговорювалися звільнення та повернення на роботу генерального директора Сема Альтмана.
Llama, популярна велика мовна модель Meta AI, стикається з труднощами при навчанні, але може досягти порівнянної якості за допомогою належного масштабування та найкращих практик на AWS Trainium. Розподілене навчання на 100+ вузлах є складним завданням, але кластери Trainium пропонують економію коштів, ефективне відновлення та покращену стабільність для навчання LLM.
Безперервна інтеграція (CI) та безперервна доставка (CD) трансформують розробку машинного навчання (ML), сприяючи співпраці, якості коду та ранньому виявленню проблем. Автоматизовані процеси в MLOps забезпечують стабільну роботу моделі та швидші ітерації для ефективної розробки моделей машинного навчання.
Агенти ШІ, такі як ChatGPT, доводять, що ШІ може працювати на рівні людини. Agent Engineering Framework спрямований на розробку ефективних ШІ-агентів.
Президент Аргентини Хав'єр Мілей зустрінеться з технологічними гігантами в Кремнієвій долині на тлі гострої економічної кризи. Зустрічі Мілея з Пічаї, Альтманом, Цукербергом, Куком і Маском викликають подив.
OpenAI створює комітет з безпеки та захисту для прийняття важливих рішень. Розробляється нова модель ШІ для заміни системи ChatGPT.
Google використовує роздільну здатність сутностей для зіставлення продуктів на різних платформах, допомагаючи компаніям електронної комерції аналізувати конкурентів і порівнювати ціни. Фреймворк Entity Resolution (ER) допомагає виявляти дублікати оголошень і встановлювати конкурентні ціни в роздрібній торгівлі.
Phi-3 від Microsoft створює менші, оптимізовані моделі класифікації тексту, перевершуючи більші моделі, такі як GPT-3. Генерація синтетичних даних за допомогою Phi-3 через Ollama покращує робочі процеси ШІ для конкретних випадків використання, пропонуючи розуміння класифікації клікбейтів та фактичного контенту.
MIT CSAIL та Google Research представляють Alchemist - систему, яка може змінювати властивості матеріалів на зображеннях за допомогою унікального інтерфейсу. Система може покращувати моделі відеоігор, візуальні ефекти штучного інтелекту та дані для навчання роботів, пропонуючи точний контроль над такими атрибутами, як шорсткість та прозорість.
Адаптація домену для LLM пояснюється в серії з 3 частин. Дізнайтеся, як ШІ-моделі борються за межі своєї «зони комфорту».
Вчені з Массачусетського технологічного інституту та лабораторії штучного інтелекту MIT-IBM Watson AI Lab розробили новий підхід до навчання комп'ютерів визначати дії на відео, використовуючи лише транскрипт. Цей метод, який називається просторово-часовим заземленням, підвищує точність ідентифікації дій у довгих відео і може знайти застосування в онлайн-навчанні та охороні здоров'я.
Цитата Пітера Друкера «What gets measured, gets managed» підкреслює важливість пріоритизації метрик для прийняття ефективних бізнес-рішень. Історія успіху Uber підкреслює важливість узгодження метрик з етапами життєвого циклу продукту для стратегічного зростання.