شهدت الأعوام الأخيرة تقدمًا كبيرًا لنماذج الذكاء الصناعي في التعامل مع النصوص والصور، لكن مطوريها يهدفون إلى إنشاء واجهات ذكاء صناعي متعددة الوسائط أكثر طموحًا.