Atacama Biomaterials, стартап, що поєднує архітектуру, машинне навчання та хімічну інженерію, розробляє екологічно чисті матеріали з різними сферами застосування. Їхні технології дозволяють створювати бібліотеки даних і матеріалів за допомогою штучного інтелекту та машинного навчання, виробляючи компостовані пластмаси та пакування з регіональних джерел.
Ризик смертності в авіації становить 0,11, що робить її одним з найбезпечніших видів транспорту. Вчені Массачусетського технологічного інституту розглядають авіацію як модель для регулювання ШІ в охороні здоров'я, щоб гарантувати, що маргіналізовані пацієнти не постраждають від упереджених моделей ШІ.
Вчені Массачусетського технологічного інституту розробили дві моделі машинного навчання - нейронну мережу "PRISM" та модель логістичної регресії - для раннього виявлення раку підшлункової залози. Ці моделі перевершили існуючі методи, виявивши 35% випадків у порівнянні зі стандартним рівнем виявлення 10%.
Дослідники з Массачусетського технологічного інституту та компанії IBM розробили новий метод під назвою "глибокий фізичний сурогат" (PEDS), який поєднує в собі фізичний симулятор з низькою точністю та генератор нейронних мереж для створення сурогатних моделей складних фізичних систем на основі даних. Метод PEDS є доступним, ефективним і зменшує кількість необхідних навчальних даних щонайменше ...
Аспіранти Массачусетського технологічного інституту використовують теорію ігор для підвищення точності та надійності моделей природної мови, прагнучи узгодити достовірність моделі з її точністю. Перетворивши генерування мови на гру для двох гравців, вони розробили систему, яка заохочує правдиві та достовірні відповіді, водночас зменшуючи кількість галюцинацій.
У цій статті досліджуються методи створення точних наборів даних для генерації запитів Cypher з тексту, використовуючи великі мовні моделі (LLM) і попередньо визначену граф-схему. Автор також згадує про поточний проект, метою якого є розробка всеосяжного набору даних для точного налаштування з використанням підходу "людина в циклі".
MIT Policy Hackathon об'єднує студентів та професіоналів з усього світу для вирішення суспільних проблем за допомогою інструментів генеративного ШІ, таких як ChatGPT. Команда-переможець "Ctrl+Alt+Defeat" фокусується на вирішенні кризи виселення в США.
У статті обговорюється важливість розуміння контекстних вікон у навчанні та використанні трансформерів, особливо з появою власних LLM і методів, таких як RAG. Досліджується, як різні фактори впливають на максимальну довжину контексту, яку може обробити трансформантна модель, і ставиться питання, чи завжди більше - це краще.
У 2017 році Google Brain представив Transformer - гнучку архітектуру, яка перевершила існуючі підходи до глибокого навчання, і тепер використовується в таких моделях, як BERT і GPT. GPT, модель декодера, використовує завдання мовного моделювання для генерації нових послідовностей і дотримується двоетапної схеми попереднього навчання та точного налаштування.
OpenAI випустила простий у використанні веб-інструмент для створення власних ШІ-помічників без кодування, який вимагає лише облікового запису Google або Microsoft і підписки OpenAI Plus на 20 доларів на місяць. Користувачі можуть персоналізувати ім'я, зображення, тон і стиль взаємодії свого ШІ-помічника, а також розширити його знання, завантаживши певні документи.
OpenAI представила оновлення моделей штучного інтелекту ChatGPT, вирішивши проблему "лінощів" у GPT-4 Turbo і запустивши нову модель GPT-3.5 Turbo за нижчою ціною. Користувачі повідомляли про зниження глибини виконання завдань у ChatGPT-4, що спонукало OpenAI відреагувати на це.
Розробка LLM-додатків може бути як захоплюючою, так і складною справою, адже потрібно враховувати безпеку, продуктивність і вартість. Починаючи з додатків з низьким рівнем ризику і приймаючи політику "Спочатку дешевий LLM", ви можете зменшити ризики і скоротити обсяг роботи, необхідний для запуску.
Програми генеративного штучного інтелекту, що використовують великі мовні моделі (LLM), мають економічну цінність, але управління безпекою, конфіденційністю та дотриманням нормативних вимог має вирішальне значення. Ця стаття містить рекомендації щодо усунення вразливостей, впровадження найкращих практик безпеки та побудови стратегій управління ризиками для додатків генеративного ШІ.
У цій статті досліджуються обмеження використання великих мовних моделей (ВММ) для аналізу діалогових даних і пропонується методологія "рецептів даних" як альтернатива. Методологія дозволяє створювати бібліотеку рецептів даних для багаторазового використання, покращуючи час відгуку і забезпечуючи внесок спільноти.
У статті обговорюється алгоритм розкладання сингулярних значень (SVD) та авторський процес рефакторингу алгоритму Якобі з Наукової бібліотеки GNU на Python/NumPy. Автор перевіряє свою функцію SVD з нуля за допомогою функції np.linalg.svd() і підкреслює корисність SVD в класичній статистиці та машинному навчанні.