تشفير

تقدم Google Photos ميزة البحث بالذكاء الاصطناعي “Ask Photos”

تحصل صور Google على مزيج من الذكاء الاصطناعي مع إطلاق ميزة تجريبية، Ask Photos، مدعومة بنموذج Gemini AI من Google. ستسمح الإضافة الجديدة، التي سيتم طرحها في وقت لاحق من هذا الصيف، للمستخدمين بالبحث في مجموعة صور Google الخاصة بهم باستخدام استعلامات اللغة الطبيعية التي تعزز فهم الذكاء الاصطناعي لمحتوى صورهم والبيانات الوصفية الأخرى.

بينما قبل أن يتمكن المستخدمون من البحث عن أشخاص أو أماكن أو أشياء محددة في صورهم، بفضل معالجة اللغة الطبيعية، فإن ترقية الذكاء الاصطناعي ستجعل العثور على المحتوى المناسب أكثر سهولة وأقل عملية بحث يدوية، حسبما أعلنت جوجل يوم الثلاثاء خلال مؤتمرها مؤتمر Google I/O 2024 السنوي للمطورين.

على سبيل المثال، بدلاً من البحث عن شيء محدد في صورك، مثل “برج إيفل”، يمكنك الآن أن تطلب من الذكاء الاصطناعي القيام بشيء أكثر تعقيدًا، مثل العثور على “أفضل صورة لكل من المتنزهات الوطنية التي قمت بزيارتها”. ” يستخدم الذكاء الاصطناعي مجموعة متنوعة من الإشارات لتحديد ما الذي يجعل الصورة “الأفضل” في مجموعة معينة، بما في ذلك أشياء مثل الإضاءة، والتعتيم، وعدم تشويه الخلفية، وما إلى ذلك. ويمكنه بعد ذلك دمج ذلك مع فهمه لتحديد الموقع الجغرافي لمجموعة من الصور أو التواريخ لاسترداد الصور الملتقطة في المتنزهات الوطنية الأمريكية فقط.

اعتمادات الصورة: جوجل

تعتمد هذه الميزة على الإصدار الأخير لـ Photo Stacks في Google Photos، والذي يجمع الصور شبه المكررة ويستخدم الذكاء الاصطناعي لتسليط الضوء على أفضل الصور في المجموعة. كما هو الحال مع Photo Stacks، الهدف هو مساعدة الأشخاص في العثور على الصور التي يريدونها مع نمو مجموعاتهم الرقمية. يتم تحميل أكثر من 6 مليارات صورة على Google Photos يوميًا، وفقًا لشركة Google، لإعطائك فكرة عن الحجم.

بالإضافة إلى ذلك، ستسمح ميزة “طلب الصور” للمستخدمين بطرح الأسئلة للحصول على أنواع أخرى من الإجابات المفيدة. بالإضافة إلى طلب أفضل الصور من إجازة أو مجموعة أخرى، يمكن للمستخدمين طرح أسئلة تتطلب فهمًا بشريًا تقريبًا لما يوجد في صورهم.

على سبيل المثال، يمكن لأحد الوالدين أن يسأل تطبيق Google Photos عن السمات التي استخدمها في حفلات أعياد الميلاد الأربع الأخيرة لطفله، ويمكنه تقديم إجابة بسيطة مصحوبة بصور ومقاطع فيديو حول موضوعات حورية البحر والأميرة ووحيد القرن التي تم استخدامها مسبقًا ومتى.

اعتمادات الصورة: جوجل

أصبح هذا النوع من الاستعلام ممكنًا لأن تطبيق صور Google لا يفهم الكلمات الرئيسية التي تدخلها فحسب، بل يفهم أيضًا مفاهيم اللغة الطبيعية، مثل “حفلة عيد ميلاد تحت عنوان”. ويمكنه أيضًا الاستفادة من إمكانات الذكاء الاصطناعي المتعددة الوسائط لفهم ما إذا كان النص الموجود في الصورة ذا صلة بالاستعلام.

مثال آخر عرضه الرئيس التنفيذي ساندر بيتشاي للصحافة قبل مؤتمر مطوري Google I/O اليوم، يُظهر مستخدمًا يطلب من الذكاء الاصطناعي أن يُظهر لهم التقدم الذي أحرزه طفلهم في السباحة. ويجمع الذكاء الاصطناعي أبرز الصور ومقاطع الفيديو للطفل وهو يسبح مع مرور الوقت.

تعمل ميزة جديدة أخرى على الاستفادة من استخدام البحث للعثور على إجابات من نص الصورة. بهذه الطريقة، يمكنك التقاط صورة لشيء ترغب في تذكره لاحقًا، مثل لوحة الترخيص أو رقم جواز السفر، ثم اطلب من الذكاء الاصطناعي استرداد تلك المعلومات عندما تحتاج إليها.

إذا ارتكب الذكاء الاصطناعي أي خطأ وقمت بتصحيحه – ربما عن طريق وضع علامة على صورة ليست من حفلة عيد ميلاد أو صورة لن تعرضها في إجازة – فسوف يتذكر تلك الاستجابة لتتحسن بمرور الوقت. وهذا يعني أيضًا أن الذكاء الاصطناعي يصبح أكثر تخصيصًا كلما تفاعلت معه أكثر.

عندما تجد صورًا جاهزة لمشاركتها، يمكن أن يساعدك الذكاء الاصطناعي في كتابة تعليق يلخص محتوى الصور. في الوقت الحالي، يعد هذا ملخصًا أساسيًا، ولكنه لا يوفر إمكانية الاختيار بين الأنماط المختلفة. (ولكن نظرًا لأنه يستخدم الجوزاء تحت الغطاء، فقد تعمل المطالبة المكتوبة بذكاء على إرجاع نمط معين إذا حاولت ذلك.)

تقول Google إنها ستطبق ضمانات لعدم الاستجابة في حالات معينة (ربما لا تطلب من الذكاء الاصطناعي “أفضل الصور العارية”؟). كما أنها لم تتضمن محتوى يحتمل أن يكون مسيئًا عند تدريب النموذج. ولكن يتم إطلاق الميزة كتجربة، لذلك قد تتطلب إضافة عناصر تحكم إضافية بمرور الوقت حيث تستجيب جوجل لكيفية استخدام الأشخاص لها.

سيتم دعم ميزة Ask Photos مبدئيًا في الولايات المتحدة باللغة الإنجليزية قبل طرحها في المزيد من الأسواق. في الوقت الحالي، ستقتصر الميزة على ميزة نصية فقط، على غرار طرح الأسئلة على برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي. ومع ذلك، بمرور الوقت، يمكن أن يتكامل بشكل أعمق مع نظام Gemini الذي يعمل على الجهاز، كما هو الحال على Android.

تدعي الشركة أن البيانات الشخصية للمستخدمين في صور Google لا تُستخدم لأغراض إعلانية. تقول Google إن البشر أيضًا لن يقوموا بمراجعة محادثات الذكاء الاصطناعي والبيانات الشخصية في Ask Photos، إلا “في حالات نادرة لمعالجة إساءة الاستخدام أو الأذى”. لا يتم أيضًا استخدام البيانات الشخصية للأشخاص في صور Google لتدريب منتجات الذكاء الاصطناعي التوليدية الأخرى، مثل Gemini.

اقرأ المزيد حول Google I/O 2024 على TechCrunch

Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى