Досягнення штучного інтелекту об'єднали НЛП і комп'ютерний зір, що призвело до появи моделей підписів до зображень, подібних до тієї, що використовується в «Покажи і розкажи». Ця модель поєднує CNN для обробки зображень і RNN для генерації тексту, використовуючи GoogLeNet і LSTM.
Моделі ML можуть розробляти оптимальні клієнтські подорожі, поєднуючи глибоке навчання з методами оптимізації. Традиційні моделі атрибуції не справляються з цим завданням через позиційну атрибуцію, контекстну сліпоту та статичні значення каналів.
LSTM, представлені в 1997 році, повертаються разом з xLSTM як потенційні конкуренти LLM у глибокому навчанні. Здатність запам'ятовувати і забувати інформацію через певні проміжки часу відрізняє LSTM від RNN, роблячи їх цінним інструментом у моделюванні мови.