طور باحثون من معهد MIT و NVIDIA أداة جديدة تُعرف باسم HART، وهي أداة مبتكرة لتوليد صور عالية الجودة بكفاءة وسرعة غير مسبوقة. تجمع هذه الأداة بين تقنيات النماذج التلقائية ونماذج الانتشار، مما يقدم حلولًا لمعضلات السرعة والدقة في توليد الصور باستخدام الذكاء الاصطناعي. هذه الخطوة تمثل تطورًا كبيرًا في مجال التصوير الرقمي وتفتح آفاقًا واسعة للتطبيقات المستقبلية.
التحديات في مجال توليد الصور
تواجه النماذج التقليدية لتوليد الصور، مثل Stable Diffusion، مشكلات تتعلق بالسرعة واستهلاك الموارد. على الرغم من قدرتها على إنتاج صور دقيقة، إلا أنها تتطلب موارد حوسبية كبيرة وتستغرق وقتًا طويلًا. في المقابل، النماذج التلقائية أسرع لكنها تعاني من نقص في الجودة ودقة التفاصيل. هنا يأتي دور HART ليقدم حلًا متكاملًا يجمع بين السرعة والدقة.
آلية عمل HART
يعتمد نموذج HART على مزيج من التقنيات لتحقيق الكفاءة العالية. يقوم النموذج التلقائي بإنشاء الصورة الأساسية بسرعة، بينما يقوم نموذج الانتشار الصغير بتحسين التفاصيل وتصحيح الأخطاء الدقيقة. بهذه الطريقة، يمكن لـ HART تحقيق جودة تنافس أو تتفوق على النماذج الانتشارية الكبيرة، ولكن بمعدل أسرع بتسع مرات تقريبًا. هذا يجعل الأداة مثالية للمهام التي تتطلب سرعة وجودة عالية.