Amazon Textract - це ML-сервіс, який з високою точністю витягує текст і дані зі сканованих документів, автоматизуючи обробку документів для різних цілей. Він пропонує рішення для спрощення перевірки статусу вакцинації, надаючи точну інформацію з карток щеплень за допомогою запитів Amazon Textract Queries.
Нейронна мережа з одним прихованим шаром, що використовує активацію ReLU, може представляти будь-які неперервні нелінійні функції, що робить її потужним апроксиматором функцій. Мережа може апроксимувати неперервні кусково-лінійні (CPWL) та неперервні криві (CC) функції, додаючи нові ReLU-функції в точках переходу для збільшення або зменшення нахилу.
Поява таких інструментів, як AutoAI, може зменшити важливість традиційних навичок машинного навчання, але глибоке розуміння основних принципів ML все одно буде затребуваним. У цій статті розглядаються математичні основи рекурентних нейронних мереж (RNN) та досліджується їх використання для виявлення послідовних закономірностей у часових рядах даних.
Ця стаття демонструє, як пошук нейронної архітектури може бути використаний для стиснення точно налаштованої BERT-моделі, покращуючи продуктивність і скорочуючи час виведення. Застосовуючи структурне обрізання, можна зменшити розмір і складність моделі, що призведе до швидшого часу відгуку і підвищення ефективності використання ресурсів.
Останні досягнення в галузі штучного інтелекту дозволили моделям імітувати людські здібності в обробці зображень і тексту, але брак пояснюваності створює ризики і обмежує впровадження. Такі критичні сфери, як охорона здоров'я та фінанси, значною мірою покладаються на табличні дані, що підкреслює потребу в прозорих моделях прийняття рішень.
У статті досліджується використання легких ієрархічних трансформаторів зору в автономній робототехніці, підкреслюється ефективність концепції спільної магістралі для багатозадачного навчання. У ній також обговорюється поява великих мультимодальних моделей та їхній потенціал у створенні уніфікованої архітектури для наскрізних рішень автономного водіння.
Spark ML - це бібліотека з відкритим вихідним кодом для високопродуктивного зберігання даних і класичних алгоритмів машинного навчання. У статті демонструється демонстраційна версія PySpark, яка прогнозує політичні симпатії за допомогою синтетичного набору даних, висвітлюється використання даних Spark та процес встановлення.
Генеральний директор Meta Марк Цукерберг оголосив, що компанія працює над створенням "загального інтелекту" для ШІ-помічників і планує випустити його з відкритим вихідним кодом, об'єднавши дослідницькі групи FAIR і GenAI. Хоча в заяві Цукерберга прямо не згадується "штучний загальний інтелект" (AGI), вона натякає на напрямок роботи Meta, який може мати значні наслідки для людства і ринків праці.
Марк Свіннертон (Mark Swinnerton) прагне перепрофілювати занедбані шахти на сховища відновлюваної енергії, використовуючи механічну систему, яка зберігає потенційну енергію від сонячних та вітрових джерел. Стартап Свіннертона, Green Gravity, моделює цю концепцію в NVIDIA Omniverse і привернув увагу чиновників в Австралії, Індії та США.
У цій статті обговорюється реалізація семантичного шару, який дозволяє агенту LLM взаємодіяти з графом знань, використовуючи такі інструменти, як інформаційний інструмент, інструмент рекомендацій та інструмент пам'яті. Ці попередньо визначені функції підвищують надійність системи та покращують загальний користувацький досвід.
Комп'ютерний зір еволюціонував від маленьких піксельних зображень до створення зображень високої роздільної здатності на основі описів, причому менші моделі покращують продуктивність у таких сферах, як фотографування смартфонів та автономні транспортні засоби. Модель ResNet домінує в комп'ютерному зорі вже майже вісім років, але з'являються нові розробки, такі як Vision Transformer (ViT), що д...
Австрійська компанія Swarovski Optik представляє бінокль AX Visio 10x32, перший у світі "розумний бінокль", який використовує технологію розпізнавання зображень для ідентифікації понад 9 000 видів птахів і ссавців. Бінокль вартістю $4,799 отримав свої ідентифікаційні можливості завдяки проекту Merlin Bird ID Корнельської орнітологічної лабораторії.
У цій статті автори обговорюють теорію та архітектуру графових нейронних мереж (ГНМ) і висвітлюють появу графових трансформаторів як тенденцію в графовому МН. Вони досліджують зв'язок між ГНМ і трансформаторами, показуючи, що ГНМ з віртуальним вузлом може імітувати трансформатор, і обговорюють переваги та обмеження цих архітектур з точки зору виразності.
Генеративні змагальні мережі (GAN) зробили революцію в ШІ, генеруючи реалістичні зображення і мовні моделі, але їхнє розуміння може бути складним. Ця стаття спрощує GAN, зосереджуючись на генеруванні синтетичних даних математичних функцій, і пояснює різницю між дискримінативними та генеративними моделями, які складають основу GAN.
У 2023 році домінували геометричні методи та програми ML, а також помітні прориви в структурній біології, включаючи відкриття двох нових антибіотиків за допомогою GNN. Зростає тенденція до конвергенції методів ML та експериментальних методів в автономному відкритті молекул, а також використання Flow Matching для швидшого та детермінованого відбору зразків.