Новая модель ИИ, основанная на фреймворке PV-RNN, учится обобщать речь и действия так же, как это делают дети младшего возраста, объединяя зрение, проприоцепцию и языковые инструкции. В отличие от больших языковых моделей (LLM), которые опираются на обширные наборы данных, эта система использует вовлечение в процесс для достижения композиционности, требуя при этом меньше данных и вычислительной мощности.