Salesforce може втратити $48 млрд ринкової вартості на тлі занепокоєння щодо низького прогнозу зростання доходів і конкуренції з конкуруючими пропозиціями в галузі штучного інтелекту. Акції компанії впали на 18% після розчаровуючих квартальних результатів, які вперше за 15 років виявилися нижчими за очікування.
Центри обробки даних великих технологій є основними джерелами глобальних викидів парникових газів, затьмарюючи комерційні рейси. Маріана Маццукато закликає ретельно вивчити вплив технологій на навколишнє середовище, звертаючи увагу на енергоємні технології, такі як ChatGPT.
ШІ може уможливити справжню міжвидову комунікацію, оскільки Тель-Авівський університет приєднався до $10-мільйонного конкурсу Coller Dolittle Challenge. Вченим пропонується створити двосторонні розмови з тваринами у революційному змаганні.
Llama, популярна велика мовна модель Meta AI, стикається з труднощами при навчанні, але може досягти порівнянної якості за допомогою належного масштабування та найкращих практик на AWS Trainium. Розподілене навчання на 100+ вузлах є складним завданням, але кластери Trainium пропонують економію коштів, ефективне відновлення та покращену стабільність для навчання LLM.
Великі мовні моделі, такі як GPT та BERT, покладаються на архітектуру трансформатора та механізм самоуваги для створення контекстуально багатих вбудовувань, що революціонізувало НЛП. Статичні вставки, такі як word2vec, не здатні вловити контекстну інформацію, що підкреслює важливість динамічних вставок у мовних моделях.
Мультимодальні моделі, такі як Claude3 і GPT-4V, інтегрують текст і зображення для кращого розуміння. Точне налаштування LLaVA на конкретних даних підвищує продуктивність у різних галузях.
Безперервна інтеграція (CI) та безперервна доставка (CD) трансформують розробку машинного навчання (ML), сприяючи співпраці, якості коду та ранньому виявленню проблем. Автоматизовані процеси в MLOps забезпечують стабільну роботу моделі та швидші ітерації для ефективної розробки моделей машинного навчання.
Колишній член правління OpenAI висловлює здивування з приводу публічного релізу ChatGPT у Twitter, який змістив фокус компанії. Також обговорювалися звільнення та повернення на роботу генерального директора Сема Альтмана.
OpenAI зіткнувся з негативною реакцією Скарлетт Йоханссон через новий чат-бот Sky, схожий на її героїню у фільмі «Вона». Глобальний саміт зі штучного інтелекту в Південній Кореї та звіт Інституту Алана Тьюринга про вплив АІ на вибори. Алекс Херн з Guardian обговорює останні розробки в галузі АІ з Мадлен Фінлі на BBC News.
Агенти ШІ, такі як ChatGPT, доводять, що ШІ може працювати на рівні людини. Agent Engineering Framework спрямований на розробку ефективних ШІ-агентів.
Вчені з Массачусетського технологічного інституту та лабораторії штучного інтелекту MIT-IBM Watson AI Lab розробили новий підхід до навчання комп'ютерів визначати дії на відео, використовуючи лише транскрипт. Цей метод, який називається просторово-часовим заземленням, підвищує точність ідентифікації дій у довгих відео і може знайти застосування в онлайн-навчанні та охороні здоров'я.
Адаптація домену для LLM пояснюється в серії з 3 частин. Дізнайтеся, як ШІ-моделі борються за межі своєї «зони комфорту».
Google використовує роздільну здатність сутностей для зіставлення продуктів на різних платформах, допомагаючи компаніям електронної комерції аналізувати конкурентів і порівнювати ціни. Фреймворк Entity Resolution (ER) допомагає виявляти дублікати оголошень і встановлювати конкурентні ціни в роздрібній торгівлі.
OpenAI створює комітет з безпеки та захисту для прийняття важливих рішень. Розробляється нова модель ШІ для заміни системи ChatGPT.
Phi-3 від Microsoft створює менші, оптимізовані моделі класифікації тексту, перевершуючи більші моделі, такі як GPT-3. Генерація синтетичних даних за допомогою Phi-3 через Ollama покращує робочі процеси ШІ для конкретних випадків використання, пропонуючи розуміння класифікації клікбейтів та фактичного контенту.