Основні висновки для науковців та менеджерів з даних: 1. Розкажіть історію, використовуючи дані, адаптовані до вашої аудиторії. 2. Ділова хватка відрізняє хороших аналітиків даних від чудових, забезпечуючи максимальний вплив на стейкхолдерів.
Salesforce може втратити $48 млрд ринкової вартості на тлі занепокоєння щодо низького прогнозу зростання доходів і конкуренції з конкуруючими пропозиціями в галузі штучного інтелекту. Акції компанії впали на 18% після розчаровуючих квартальних результатів, які вперше за 15 років виявилися нижчими за очікування.
Найбільші технологічні компанії, такі як Google, Microsoft і Meta, об'єдналися в групу UALink, щоб розробити новий стандарт з'єднання чіпів для прискорювачів ШІ, кинувши виклик домінуванню NVLink від Nvidia. UALink має на меті створити відкритий стандарт для вдосконалення апаратного забезпечення ШІ, уможливити співпрацю та звільнитися від пропрієтарних екосистем, подібних до екосистеми Nvidia.
Нещодавня стаття Anthropic заглиблюється в механічну інтерпретованість великих мовних моделей, показуючи, як нейронні мережі представляють значущі концепції за допомогою напрямків у просторі активації. Дослідження надає докази того, що ознаки, які можна інтерпретувати, корелюють з конкретними напрямками, впливаючи на результат роботи моделі.
Нейробіолог представив spatstat для просторового аналізу розподілу клітин у мозку. Точковий паттерн-аналіз (PPA) дозволяє детально дослідити просторовий розподіл клітин, пропонуючи відтворювану інформацію.
Рішення AWS для аналізу медіа та оцінки політики на основі штучного інтелекту спрощує вилучення та оцінку відео для рекламних та освітніх компаній. Удосконалена модерація контенту забезпечує безпеку бренду та відповідність вимогам, а також підвищує залученість користувачів та ефективність реклами.
У звіті OpenAI йдеться про те, що штучний інтелект використовувався для дезінформаційних кампаній з боку Росії, Китаю, Ізраїлю та Ірану, але не зміг охопити широку аудиторію. Генеративні моделі АІ використовувалися для створення та розміщення пропагандистських матеріалів у соціальних мережах.
OpenAI зіткнувся з негативною реакцією Скарлетт Йоханссон через новий чат-бот Sky, схожий на її героїню у фільмі «Вона». Глобальний саміт зі штучного інтелекту в Південній Кореї та звіт Інституту Алана Тьюринга про вплив АІ на вибори. Алекс Херн з Guardian обговорює останні розробки в галузі АІ з Мадлен Фінлі на BBC News.
Колишній член правління OpenAI висловлює здивування з приводу публічного релізу ChatGPT у Twitter, який змістив фокус компанії. Також обговорювалися звільнення та повернення на роботу генерального директора Сема Альтмана.
Мультимодальні моделі, такі як Claude3 і GPT-4V, інтегрують текст і зображення для кращого розуміння. Точне налаштування LLaVA на конкретних даних підвищує продуктивність у різних галузях.
Безперервна інтеграція (CI) та безперервна доставка (CD) трансформують розробку машинного навчання (ML), сприяючи співпраці, якості коду та ранньому виявленню проблем. Автоматизовані процеси в MLOps забезпечують стабільну роботу моделі та швидші ітерації для ефективної розробки моделей машинного навчання.
Llama, популярна велика мовна модель Meta AI, стикається з труднощами при навчанні, але може досягти порівнянної якості за допомогою належного масштабування та найкращих практик на AWS Trainium. Розподілене навчання на 100+ вузлах є складним завданням, але кластери Trainium пропонують економію коштів, ефективне відновлення та покращену стабільність для навчання LLM.
Агенти ШІ, такі як ChatGPT, доводять, що ШІ може працювати на рівні людини. Agent Engineering Framework спрямований на розробку ефективних ШІ-агентів.
Великі мовні моделі, такі як GPT та BERT, покладаються на архітектуру трансформатора та механізм самоуваги для створення контекстуально багатих вбудовувань, що революціонізувало НЛП. Статичні вставки, такі як word2vec, не здатні вловити контекстну інформацію, що підкреслює важливість динамічних вставок у мовних моделях.
Phi-3 від Microsoft створює менші, оптимізовані моделі класифікації тексту, перевершуючи більші моделі, такі як GPT-3. Генерація синтетичних даних за допомогою Phi-3 через Ollama покращує робочі процеси ШІ для конкретних випадків використання, пропонуючи розуміння класифікації клікбейтів та фактичного контенту.