Новий штучний інтелект від Anthropic – Claude 3.5 Sonnet тепер може керувати комп’ютером так само, як і людина. Модель використовує скріншоти екрана для навігації в додатках та виконання таких завдань, як натискання кнопок, введення тексту чи збір інформації.
Останній реліз від Stability AI, Stable Diffusion 3.5, презентував три нові моделі, які забезпечують підвищену якість і швидкість генерації зображень, та доступність для споживчого обладнання. Моделі безкоштовні для некомерційного використання та інтегрують сучасні функції безпеки.
Нобелівські премії 2024 року з фізики та хімії встановили прецедент для визнання внеску штучного інтелекту у науку. Хоча деякі вчені ставлять під сумнів відповідність ШІ традиційним дисциплінам, інші вважають це необхідним кроком для визнання міждисциплінарного характеру сучасних досліджень.
Нова нейронна мережа від Бостонського університету – Neural Phase Retrieval використовує методи глибокого навчання для поліпшення реконструкції зображень з високою роздільною здатністю з даних з низькою роздільною здатністю. Результати NeuPh вже успішно перевершили традиційні методи.
Патентне відомство Індії видало патент на інноваційну систему посадки міні-БПЛА. Ця технологія забезпечує точне приземлення у складних місцевостях і має потенційне застосування як у військовій, так і в цивільній логістиці, включаючи екстрену допомогу та доставку на великій висоті.
Оновлена модель генерації зображень від Ideogram AI пропонує суттєві покращення, які можуть перевершити можливості таких ШІ генераторів, як MidJourney і Leonardo AI. Нові функції вже доступні, зокрема різноманітні стилі, підвищена реалістичність та розширені інструменти для текстових промптів.
Нова система уникнення зіткнень для безпілотників використовує бортові датчики і камери для автономного запобігання аварій у повітрі. Ця технологія має на меті сприяти безпечній та ефективній роботі БПЛА у все більш переповненому повітряному просторі.
Нова система комп’ютерного зору значно зменшує енергоспоживання і забезпечує просторове усвідомлення в режимі реального часу. Вона покращує здатність ШІ точно сприймати 3D-простір і має вирішальне значення для таких технологій, як безпілотні автомобілі та дрони.
Модель Gen-3 Alpha володіє потужними інструментами для створення високоякісного відео, пропонуючи користувачам безпрецедентний рівень контролю та реалістичності. Завдяки вдосконаленим функціям і винятковій якості, модель випереджає конкурентів і встановлює нові стандарти у створенні контенту за допомогою ШІ.
Проводячи експерименти та покращуючи їх аналіз, MAIA може інтерпретувати нейронні мережі, що підвищує розуміння роботи ШІ моделей. Цей агент може визначати активність нейронів, видаляти нерелевантні функції та виявляти упередження, роблячи системи ШІ безпечнішими та більш прозорими.
Перегони дронів стали використовувати для тестування нейронних мереж для майбутніх космічних місій. Цей проєкт спрямований на автономне керування складними маневрами космічного корабля, оптимізацію бортових операцій і підвищення ефективності та надійності місії.
Завдяки радарним супутникам, які надають безперервні, високоточні дані про поверхню Землі, та швидкому й доступному програмному забезпеченню з відкритим кодом, цифрові моделі рельєфу створюються усього в один клік. Це дозволяє ефективно відстежувати зміни рельєфу та природні явища.
Nemotron-4 340B – це нове сімейство моделей для синтетичної генерації даних і налаштування ШІ. Навчена на 9 трильйонах токенів, модель відзначається значною оптимізацією продуктивності та забезпеченням якості даних, значно розширюючи можливості ШІ в різних галузях.
Зі значним збільшенням використання БПЛА в останні роки зростає і занепокоєння щодо безпеки їх застосування. У зв'язку з цим була розроблена нова система, яка використовує комп'ютерний зір та алгоритми глибокого навчання для точного та швидкого виявлення і відстеження дронів.
ШІ навчився розшифровувати собачий гавкіт, відрізняючи грайливий гавкіт від агресивного, а також визначати вік, стать і породу собаки. Спочатку навчені на людській мові, моделі ШІ досягли вражаючої точності і обіцяють значні покращення в комунікації та догляді за тваринами.
Подібно до приближення сильного холодного фронту, у спільноті синоптиків відбуваються серйозні зміни. Очікуваний результат? Абсолютно новий спосіб прогнозування погоди на основі ШІ, який працює на персональному комп’ютері.
Дослідники з Лабораторія комп’ютерних наук і штучного інтелекту МІТ та Google Research вчинили справжню магію зі своєю останньою розробкою – дифузійна модель, яка може змінювати властивості матеріалу об’єктів на зображеннях.
Компанія OpenAI презентувала GPT-4о – унікальну омнімодель, яка поєднує обробку тексту, звуку та зображень, що дозволяє їй працювати швидше та ефективніше, ніж будь-коли раніше.
SenseNova – остання модель штучного інтелекту від SenseTime Group викликала хвилю інтересу на ринку завдяки своїм вражаючим досягненням, включаючи вдосконалене опрацювання інформації, математичне мислення та лінгвістичні здібності.
Остання розробка від компанії Meta AI – Llama 3 може похвалитися неперевершеною обробкою мовлення, що підвищує її здатність виконувати складні задачі. Завдяки збільшеному словниковому запасу та розширеним функціям безпеки підвищено продуктивність і універсальність моделі.
Досліджуйте вражаючий процес синтезу музики із сервісами Udio та Suno. Моделі ШІ з легкістю генерують повноцінні пісні в різних жанрах, а додаткові параметри платформ дають змогу користувачам експериментувати із стилями та створювати оригінальні мелодії за лічені секунди.
Машинне "відучування" дозволяє генеративному ШІ вибірково забувати проблемні дані без тривалого перенавчання. Цей метод здатний забезпечити дотримання правових та етичних норм, зберігаючи при цьому творчі здібності моделей з генерації зображень.
DeepMind від Google розробив SAFE – новий метод фактології для великих мовних моделей, таких як ChatGPT. Перевірка фактів штучним інтелектом вже продемонструвала вражаючі результати, перевершуючи показники точності спеціалістів, які виконують фактчекінг.
Дослідники з МІТ розробили новий метод, який спрощує генерацію зображень до одного кроку. Команда вдосконалила існуючі моделі, такі як Stable Diffusion, продемонструвавши здатність нового фреймворку швидко створювати високоякісний візуальний контент.
Stability AI представила новий прорив у моделях ШІ для генерації зображень – Stable Diffusion 3. Її розширений діапазон параметрів та архітектура дифузійного трансформатора гарантують створення складних, високоякісних зображень та точний переклад тексту в візуальний контент.
Останнє творіння від OpenAI – Sora – створює захоплюючі відео, демонструючи неперевершену реалістичність візуальних композицій. Завдяки поєднанню обробки мови та генерації відео, модель може інтерпретувати текстові підказки, пристосовуватися до різних способів введення даних та імітувати динамічний рух камери.
Черпаючи натхнення від Gemini, Gemma сфокусована на відкритості та доступності, пропонуючи універсальні моделі, які підходять для різних пристроїв і фреймворків. Модель знаменує собою значний крок до демократизації ШІ, наголошуючи на прозорості та відповідальному розвитку технологій.
Amazon представив модель TTS з інноваційною архітектурою, яка встановлює новий стандарт для синтезу мовлення. BASE TTS не тільки забезпечує неперевершену природність мовлення, але й демонструє надзвичайну адаптивність у обробці різноманітних мовних нюансів.
MPT-7B пропонує оптимізацію архітектури та покращення продуктивності, включаючи сумісність з екосистемою HuggingFace. Навчена на 1 трильйоні токенів тексту та коду, модель встановлює новий стандарт LLM для комерційного використання.
Глибоке активне навчання поєднує традиційне навчання нейронної мережі зі стратегічним відбором зразків даних. Такий інноваційний підхід дозволяє підвищити продуктивність, ефективність і точність моделі в широкому спектрі застосувань.
Інтеграція високопродуктивного обчислювального скринінгу та алгоритмів МН дозволила вченим подолати традиційні обмеження, сприяючи динамічному дослідженню матеріалів. Ця комбінація призвела до відкриття нових матеріалів з унікальними властивостями.
Модель StableRep покращує процес навчання ШІ за рахунок синтетичного відтворення. Генеруючи різноманітні зображення за допомогою текстових промтів, вона не тільки вирішує проблеми збору даних, але й сприяє впровадженню більш ефективних і вигідних альтернатив навчання.
Тест Тьюринга, який колись став новаторським для виявлення машинного мислення, тепер обмежений здатністю ШІ імітувати людські реакції. У новому дослідженні представлено триступеневу систему, яка дозволяє визначити, чи може ШІ міркувати як людина.
QuData представляє комп'ютеризовану систему діагностики раку молочної залози на основі ШІ. Ця інноваційна технологія забезпечує раннє виявлення онкопатологій та оперативне втручання, знаменуючи значний крок уперед до доступного, точного та своєчасного лікування з кращими результатами.
Новаторська модель Gemini AI має намір перевершити усі існуючі досягнення у сфері штучного інтелекту. Завдяки своїй мультимодальності, масштабованості в різних сферах і потенціалу інтегруватись в екосистему Google, Gemini AI робить значний стрибок для розвитку технологій ШІ.
ALERTA-Net — нова глибока нейронна мережа, що поєднує соціальні мережі, макроекономічні показники та інформацію пошукових систем. Унікальна модель передбачає рух цін на акції та волатильність фондового ринку, виходячи за межі традиційних методів аналізу.
У 1950 році британський вчений Алан Тюрінг запропонував тест, який визначає, чи здатні машини мислити. На сьогоднішній день, ще жодному штучному інтелекту не вдалося успішно його пройти. Чи буде ChatGPT першим?
OpenAI провела вражаючий DevDay та презентувала новий функціонал. Поринь у світ інновацій та розшир свої горизонти у роботі зі штучним інтелектом. Дізнайся про гарячі новинки у нашій статті!
У продовження досліджень про деревоподібні архітектури вивчається питання про необхідність глибокого навчання для ШІ та пропонуються альтернативні методи машинного навчання, які можуть бути більш ефективними для складних завдань класифікації.
Новий метод оцінки руху дозволяє отримувати довгострокові траєкторії руху для кожного пікселя в кадрі, навіть у разі швидких рухів та складних сцен. Дізнайтеся більше про захоплюючу технологію та майбутній аналіз руху в статті про OmniMotion.
TalkToModel – інноваційна система для забезпечення відкритих діалогів із моделями МН. Ця платформа дозволяє користувачам не тільки розуміти, але й спілкуватися з моделями МН природною мовою, а також отримувати пояснення процесів їх роботи.
Останні дослідження у сфері ШІ, які засновано на деревоподібній архітектурі, відкривають нові перспективи для навчання штучних нейронних мереж.
Останні дослідження демонструють, що, незважаючи на широке використання CAPTCHA як захисту від автоматизації, сучасні боти краще і швидше вирішують завдання CAPTCHA ніж люди.
SeamlessM4T руйнує мовні бар'єри завдяки своїм комплексним можливостям перекладу та транскрипції. Ця модель ШІ може легко перетворити мову або текст, забезпечуючи переклад у режимі реального часу та сприяючи міжкультурному взаєморозумінню.
Модель OncoNPC точно ідентифікує місцезнаходження пухлин, які важко відслідкувати, що сприяє цілеспрямованому та персоналізованому лікуванню. Для визначення новоутворення, обчислювальна модель здатна проаналізувати послідовність 400 генів.
Нове дослідження по вдосконаленню технологій комп’ютерного зору поєднує науки про великі дані та фізику. Таке гібридне комп’ютерне бачення дозволяє ШІ усвідомленно сприймати, взаємодіяти та реагувати на зовнішнє середовище в реальному часі.
Завдяки інноваційному методу "curious replay" агенти ШІ тепер здатні самостійно аналізувати набутий досвід та досліджувати нове середовище, що значно покращує їхню здатність адаптуватися та підвищує ефективність роботи.
Дослідники працюють над більш ефективним методом машинного навчання для невизначених реальних ситуацій. Новий алгоритм визначатиме, коли "машина-учень" повинна слухатися свого учителя, а коли вчитися самостійно.
Нова архітектура має на меті подолати існуючі обмеження нейронних мереж та символічного ШІ. Запропонована модель вже демонструє високу ефективність у вирішенні логічних завдань, відкриваючи перспективу для інтеграції різних парадигм ШІ.
Сонячні батареї на основі гібридних органо-неорганічних перовскітів є наразі напрямом альтернативної енергетики, який найактивніше розвивається. Ці молекули започаткували розвиток нового класу фотовольтаїчних пристроїв – перовскітних сонячних елементів.
Дослідники використали набір простих програм для генерації зображень, щоб створити набір даних та навчити модель комп'ютерного зору. Такий підхід сприяє покращенню продуктивності моделей класифікації зображень, навчених на синтетичних даних.
Вчені розробили новий підхід до моделювання руху, використовуючи відносну зміну положення. Вони оцінили здатність архітектур глибинних нейронних мереж моделювати рух за допомогою задач розпізнавання та прогнозування руху.
Дослідники розробили новий алгоритм ШІ, спрямований на візуалізацію кластерів даних та інших макроскопічних ознак так, щоб вони були максимально чіткими, легкими для спостереження та зрозумілими людині.
Вчені розробили модель DetectGPT, яка у 95% випадків може відрізнити текст, написаний людиною, від тексту, згенерованого за допомогою популярних мовних моделей з відкритим вихідним кодом.
Дослідники створили нову нейроморфну обчислювальну систему, що підтримує генеративний та графічний клас моделей глибинного навчання та можливість роботи з нейронними моделями глибинного навчання.
Група вчених розробила новий спосіб прогнозування викидів амінів на заводах з уловлювання вуглецю, використовуючи машинне навчання та експериментальні дані стрес-тесту, проведеного на заводі в Німеччині.
Вчені розробили перший штучний біореалістичний нейрон, який може ефективно взаємодіяти зі справжніми біологічними нейронами.
Вчені розробили біонічний палець, який може створювати 3D-карти внутрішньої структури матеріалів, торкаючись їх зовнішньої поверхні.
Бездротова м'яка електронна шкіра може як виявляти, так і передавати відчуття дотику, а також формувати сенсорну мережу, що відкриває великі можливості для покращення інтерактивного сенсорного спілкування.
Meta AI запустила LLaMA, серію базових мовних моделей, які можуть конкурувати або навіть перевершити найкращі моделі з існуючих, такі як GPT-3, Chinchilla та PaLM.
MusicLM – це штучний інтелект нового покоління, який створює високоякісну музику на основі текстових описів подібно до того, як DALL-E створює зображення з текстів.
Вчені з Мічиганського університету дослідили стратегії поведінки роботів для відновлення довіри між ботом і людиною. Чи зможуть такі стратегії повністю відновити довіру і наскільки вони ефективні після повторних помилок ботів?
Група дослідників створила Байєсівську машину з використанням мемристорів. Вона є більш енергоефективною, ніж існуючі апаратні рішення, і може використовуватися для критичних з точки зору безпеки додатків.
Завдяки досягненням у сфері штучного інтелекту інженери з Колорадського Університету в Боулдері працюють над новим типом тростини для сліпих або людей із вадами зору.
Дослідники Тель-Авівського університету досягли технологічного прориву: новий біологічний датчик фіксує наявність запаху та надсилає інформацію про нього роботу для інтерпретації результатів
Моделі синтезу мови зазвичай потребують тривалих зразків аудіофайлів для опрацювання, тоді як VALL-E імітує голос усього за декілька секунд звукозапису.
Дослідники зі Стенфордського університету розробили новий тип еластичного біосумісного матеріалу, який розпилюється на зовнішню сторону рук та може розпізнавати їх рухи.
Point E – це нова система текстового синтезу 3D-зображень, яка спочатку формує штучне уявлення про об'єкт, а потім на його основі створює кольорові хмари точок.
Безпілотні автомобілі вже давно вважаються видом транспорту нового покоління. Для забезпечення автономної навігації таких транспортних засобів необхідно впровадити багато різноманітних технологій.
Нове дослідження Тихоокеанської північно-західної національної лабораторії передбачає використання машинного навчання, аналізу даних та штучного інтелекту для виявлення потенційних ядерних загроз.
Дослідники запропонували нові способи використання ШІ разом із відеоспостереженням для роздрібної торгівлі, щоб краще розуміти поведінку споживачів та адаптувати планування магазинів для збільшення продажів.
Декодування мовлення на основі активності головного мозку було давньою метою неврологів і клініцистів. Наразі, компанія Meta представили результати дослідження моделі ШІ, яка може декодувати мову, використовуючи неінвазивні методи дослідження.
Додаток Look to Speak від Google здатний допомогти людям з порушеннями моторики та проблемами мовлення легше спілкуватися. Використовуючи лише очі, програма дозволяє вибирати заздалегідь підготовлені фрази і озвучувати їх.
Дослідники з Массачусетського технологічного інституту розробили техніку машинного навчання, яка точно фіксує та моделює основну акустику місцевості лише з невеликої кількості звукових записів.
До 2050 року людству доведеться майже вдвічі збільшити світові запаси продовольства, щоб забезпечити кожного жителя планети достатньою кількістю їжі. Оскільки зміна клімату відбувається дедалі швидше, водні ресурси скорочуються, а орні землі руйнуються, гарантувати сталий розвиток стане серйозним викликом.
За останнє десятиліття різке зростання вартості виробництва відеоігор класу ААА стало однією з найбільш серйозних проблем в ігровій індустрії. Студії завжди шукають технології, які б могли допомогти знизити вартість розробки ігор. Останні досягнення в нейронних моделях генерації зображень вселяють надію, що реалізація цієї мрії може бути не такою вже далекою.
Чи можуть комп’ютери мислити? Чи можуть моделі штучного інтелекту (ШІ) бути свідомими? Ці та подібні запитання часто виникають під час обговорення нещодавнього прогресу ШІ, досягнутого за допомогою моделей природної мови GPT-3, LAMDA та інших перетворювачів. Тим не менш, вони все ще суперечливі і знаходяться на межі парадоксу, тому що зазвичай існує безліч прихованих припущень і помилкових уявлень про те, як працює мозок і що означає мислення. Немає іншого шляху, окрім як точно обґрунтувати ці припущення, а потім дослідити, як саме обробка інформації людиною може бути відтворена машинами.
Зараз вже нікого не здивувати фільтрами, які покращують якість фотографій. Але реставрація старих портретів поки що залишає бажати кращого. Старі фотографії бувають надто розмитими, тому звичайні методи підвищення чіткості зображень на них не працюють.
Компанія Facebook виклала у відкритий доступ проєкт NLLB (No Language Left Behind). Головною особливістю цієї розробки є охоплення понад двохсот мов, у тому числі рідкісних мов африканських та австралійських народів. Крім того, Facebook застосував новий підхід до моделі машинного навчання, де переклад здійснюється безпосередньо з однієї мови на іншу, без перехідного перекладу англійською мовою.
Анімовані аватари вже давно стали частиною нашого життя. А ось реалістичне моделювання анімації одягу досі залишалося невирішеним завданням.
З одного боку, сучасні методи фізичного моделювання можуть генерувати реалістичну геометрію одягу з інтерактивною швидкістю. З іншого, моделювання фотореалістичного зовнішнього вигляду зазвичай потребує фізичного рендерингу, який занадто дорогий для інтерактивних програм.
Група вчених, що використовують машинне навчання, «заново відкрила» закон Всесвітнього тяжіння.
Для цього вони навчили «графічну нейронну мережу» моделювати динаміку Сонця, планет і великих планет Сонячної системи з 30 років спостережень. Потім вони використали символічну регресію, щоб виявити аналітичне вираження закону сили, неявно вивченого нейронною мережею.