У статті обговорюється важливість розуміння контекстних вікон у навчанні та використанні трансформерів, особливо з появою власних LLM і методів, таких як RAG. Досліджується, як різні фактори впливають на максимальну довжину контексту, яку може обробити трансформантна модель, і ставиться питання, чи завжди більше - це краще.
У 2017 році Google Brain представив Transformer - гнучку архітектуру, яка перевершила існуючі підходи до глибокого навчання, і тепер використовується в таких моделях, як BERT і GPT. GPT, модель декодера, використовує завдання мовного моделювання для генерації нових послідовностей і дотримується двоетапної схеми попереднього навчання та точного налаштування.
OpenAI випустила простий у використанні веб-інструмент для створення власних ШІ-помічників без кодування, який вимагає лише облікового запису Google або Microsoft і підписки OpenAI Plus на 20 доларів на місяць. Користувачі можуть персоналізувати ім'я, зображення, тон і стиль взаємодії свого ШІ-помічника, а також розширити його знання, завантаживши певні документи.
Програми генеративного штучного інтелекту, що використовують великі мовні моделі (LLM), мають економічну цінність, але управління безпекою, конфіденційністю та дотриманням нормативних вимог має вирішальне значення. Ця стаття містить рекомендації щодо усунення вразливостей, впровадження найкращих практик безпеки та побудови стратегій управління ризиками для додатків генеративного ШІ.
Розробка LLM-додатків може бути як захоплюючою, так і складною справою, адже потрібно враховувати безпеку, продуктивність і вартість. Починаючи з додатків з низьким рівнем ризику і приймаючи політику "Спочатку дешевий LLM", ви можете зменшити ризики і скоротити обсяг роботи, необхідний для запуску.
OpenAI представила оновлення моделей штучного інтелекту ChatGPT, вирішивши проблему "лінощів" у GPT-4 Turbo і запустивши нову модель GPT-3.5 Turbo за нижчою ціною. Користувачі повідомляли про зниження глибини виконання завдань у ChatGPT-4, що спонукало OpenAI відреагувати на це.
У цій статті досліджуються обмеження використання великих мовних моделей (ВММ) для аналізу діалогових даних і пропонується методологія "рецептів даних" як альтернатива. Методологія дозволяє створювати бібліотеку рецептів даних для багаторазового використання, покращуючи час відгуку і забезпечуючи внесок спільноти.
У цій статті досліджується монокулярна оцінка глибини (MDE) та її важливість для додатків комп'ютерного зору. Вона містить покрокову інструкцію із завантаження та візуалізації даних карти глибини, запуску виведення за допомогою Marigold і DPT, а також оцінювання прогнозів глибини за допомогою набору даних SUN RGB-D.
У статті обговорюється алгоритм розкладання сингулярних значень (SVD) та авторський процес рефакторингу алгоритму Якобі з Наукової бібліотеки GNU на Python/NumPy. Автор перевіряє свою функцію SVD з нуля за допомогою функції np.linalg.svd() і підкреслює корисність SVD в класичній статистиці та машинному навчанні.
Провідне розвідувальне агентство Великобританії попереджає, що з впровадженням штучного інтелекту зросте зловмисна кіберактивність, причому найбільшу загрозу становитимуть програми-вимагачі. ШІ знизить бар'єри для входу, дозволяючи як новачкам, так і досвідченим зловмисникам використовувати вразливості та ефективніше обходити засоби захисту.
GeForce NOW піднімає рівень комп'ютерних ігор на мобільних пристроях завдяки підтримці високої роздільної здатності на Android, пропонуючи захоплюючий ігровий процес на ходу. Нові ігри, додані до бібліотеки, включають Stargate: Хранителі часу, Enshrouded та Metal: Hellsinger.
NVIDIA представляє RTX Video HDR, що використовує штучний інтелект для перетворення відео зі стандартним динамічним діапазоном у приголомшливе HDR на дисплеях з роздільною здатністю HDR10. Новий GeForce RTX 4070 Ti SUPER пропонує підвищену продуктивність для редагування та рендерингу відео, працюючи до 2,5 разів швидше завдяки DLSS 3.
Ентузіаст науки про дані створює успішний веб-додаток зі штучним інтелектом, який обслуговує тисячі користувачів, ділячись технічними порадами та уроками, отриманими на цьому шляху, включаючи використання Next.js, FastAPI та AWS Lambda для розгортання, а також Firebase + Stripe для автентифікації користувачів та платежів.
Рішення на основі генеративного штучного інтелекту трансформують бізнес, але вони можуть призводити до фактичних неточностей. Конвеєр Retrieval Augmented Generation (RAG), що використовує стек технологій на основі штучного інтелекту, пропонує точні, прозорі та безпечні додатки для генеративного ШІ, надаючи додаткову інформацію із зовнішнього джерела знань.
Компанія Google анонсувала Lumiere - передовий відеогенератор ШІ-тексту, здатний створювати реалістичні відео з милими тваринами в різних сценаріях. Унікальна архітектура Lumiere дозволяє йому генерувати всю часову тривалість відео одночасно, досягаючи глобальної часової узгодженості.