Дослідники Массачусетського технологічного інституту розробили PRoC3S - метод, що поєднує великі мовні моделі та моделі зору для безпечного та ефективного керування роботами при виконанні складних завдань. Цей інноваційний підхід дозволяє роботам виконувати різноманітні завдання в динамічному середовищі, демонструючи синергію між мовними моделями та класичними робототехнічними системами.
CV VideoPlayer, пакет Python для дослідження комп'ютерного зору, спрощує візуалізацію відео та налагодження завдяки інтерактивним функціям. Він дозволяє легко налаштовувати накладання та редагування кадрів, покращуючи процес розробки для фахівців-практиків.
Використання GPT-3.5 та Unstructured API для ефективного перекладу мемуарів Кармен Рози з іспанської на англійську зі збереженням суті оповіді. Технічна реалізація включає імпорт книги, переклад за допомогою GPT-3.5 та експорт у формат Docx з використанням API Unstructured.
EBSCOlearning співпрацює з AWS GenAIIC, щоб трансформувати процес оцінювання навчання за допомогою технології генеративного ШІ. Проблеми генерації контролю якості вирішуються за допомогою рішення на основі штучного інтелекту для масштабованого високоякісного оцінювання.
Співробітники британського Інституту Алана Тьюринга попереджають про ризики для довіри через звільнення керівництва та скорочення витрат. 90 співробітників висловлюють занепокоєння опікунам щодо керівництва організації.
Нова модель OpenAI o1 перевершує ChatGPT-40. Експеримент з генерацією коду на Python за допомогою ChatGPT-o1 дає 90% точності.
Берлінська компанія Vay пропонує унікальний сервіс телеводіння з використанням технології NVIDIA для безпечного дистанційного керування автомобілем у реальному часі. Vay змінює мобільність завдяки автономному водінню, керованому людиною та визначеному штучним інтелектом, встановлюючи новий стандарт у міському транспорті.
DDPG покращує медичну робототехніку, керовану штучним інтелектом, вирішуючи проблему безперервного управління діями. Фреймворк Actor-Critic в DDPG поєднує в собі DPG і DQN для підвищення стабільності та продуктивності в середовищах з безперервними діями.
Масштабовані симуляції з OpenUSD і NVIDIA Omniverse сприяють розвитку робототехніки, забезпечуючи реалістичне тестування і навчання ШІ у віртуальних середовищах. Такі компанії, як Cobot і Field AI, використовують Isaac Sim для перевірки продуктивності роботів і створення моделей ШІ для різноманітних застосувань.
Інструменти штучного інтелекту Apple можуть переписувати тексти та електронні листи, але лінгвісти попереджають про втрату нюансів і характеру. Технологія спрямована на те, щоб користувачі звучали більш дружелюбно або професійно.
Data scientists, які переходять на керівні посади, потребують бізнес-навичок, таких як вільне володіння фінансами, щоб керувати ефективними ініціативами в галузі даних. Розуміння фінансових умов може допомогти адаптувати інсайти, підвищити успіх компанії і навіть домовитися про кращу оплату праці. Знання цифр відкриває двері до таких можливостей, як податкові знижки на інвестиції в R&D.
Графічні процесори NVIDIA RTX забезпечують 1300 найкращих результатів у іграх і творчості на основі ШІ. Приєднуйтесь до #WinterArtChallenge, щоб продемонструвати своє мистецтво та виграти можливість з'явитися в соціальних мережах NVIDIA Studio.
Новий інструмент OpenAI, Sora, створює реалістичні відеокліпи з підказок, що викликає занепокоєння щодо розмивання межі між реальністю та контентом, створеним штучним інтелектом. Незважаючи на вражаючі візуальні ефекти, журналіст відчував себе радше засмученим, ніж враженим, коли побачив цей дивовижний реалізм.
Даніела Рус з Массачусетського технологічного інституту отримала премію Джона Скотта 2024 року за новаторські дослідження в галузі робототехніки, які переосмислюють можливості роботів за межами традиційних норм. Робота Рус зосереджена на розробці зрозумілих алгоритмів для створення колаборативних роботів, здатних вирішувати реальні проблеми, підкреслюючи синергію між тілом і мозком для інтелек...
Дослідники з Массачусетського технологічного інституту розробили систему, що використовує великі мовні моделі для перетворення складних пояснень ШІ на просту мову, покращуючи розуміння користувача. Система оцінює якість розповіді, що дозволяє користувачам довіряти прогнозам машинного навчання і налаштовувати пояснення відповідно до конкретних потреб.