مساعد افتراضي
االمساعد الافتراضي الذكي (IVA) أو المساعد الشخصي الذكي (IPA) هو وكيل برمجيات يمكنه أداء المهام أو الخدمات للفرد بناءً على أوامر أو أسئلة. أحيانًا يتم استخدام مصطلح «روبوت الدردشة» للإشارة إلى المساعدين الافتراضيين بشكل عام أو للوصول إليهم بشكل خاص من خلال الدردشة عبر الإنترنت. في بعض الحالات، تكون برامج الدردشة عبر الإنترنت مخصصة للأغراض الترفيهية حصريًا. يستطيع بعض المساعدين الافتراضيين تفسير الكلام البشري والاستجابة من خلال الأصوات المركبة. يمكن للمستخدمين طرح أسئلة على مساعديهم، والتحكم في أجهزة التشغيل الآلي للمنزل وتشغيل الوسائط عبر الصوت، وإدارة المهام الأساسية الأخرى مثل البريد الإلكتروني، وقوائم المهام والتقويمات باستخدام الأوامر الشفهية (المنطوقة).[1] أنظمة الحوار هو مفهوم مماثل، ولكن مع وجود اختلافات.[2]
اعتبارًا من عام 2017، توسعت إمكانيات واستخدامات المساعدين الافتراضيين بسرعة، مع دخول منتجات جديدة إلى السوق وتركيز قوي على كل من واجهات مستخدم البريد الإلكتروني والصوت. لدى أبل وجوجل قواعد كبيرة مثبتة من المستخدمين على الهواتف الذكية. تمتلك مايكروسوفت قاعدة كبيرة مثبتة من أجهزة الكمبيوتر الشخصية والهواتف الذكية والسماعات الذكية المستندة إلى ويندوز. تمتلك أمازون قاعدة مثبتة كبيرة لمكبرات الصوت الذكية.[3] لدى كونفرسيكا أكثر من 100 مليون مشاركة عبر المساعدون الافتراضيون الذكيون للبريد الإلكتروني وواجهة الرسائل القصيرة للأعمال.
التاريخ
عدلالعقود التجريبية: 1910 - 1980
عدلكان راديو ريكس أول لعبة يتم تفعيلها بالصوت في عام 1911.[4] كان كلبًا يخرج من منزله عند مناداة اسمه.
في عام 1952، قدمت مختبرات Bell آلة التعرف التلقائي على الأرقام Audrey. احتلت الآلة رف ترحيل بارتفاع ستة أقدام، واستهلكت طاقة كبيرة، وكان بها العديد من الكابلات وتعرضت لمشاكل صيانة عديدة مرتبطة بدوائر الأنابيب المفرغة المعقدة. يمكن للألة التعرف على الوحدات الأساسية للكلام، الصوتيات. كانت الآلة تقتصر على التعرف الدقيق على الأرقام التي يتحدث بها متحدثون معينون. لذلك، كان يمكن استخدامها للاتصال الصوتي، ولكن في معظم الحالات، كان الاتصال بالضغط على الزر أرخص وأسرع، بدلاً من التحدث بالأرقام المتتالية.[5]
من الأدوات المبكرة الأخرى التي تم تمكينها لإجراء التعرف الرقمي على الكلام كانت الآلة الحاسبة التي يتم تنشيطها صوتيًا من IBM Shoebox، والتي تم تقديمها لعامة الناس خلال معرض سياتل العالمي عام 1962 بعد إطلاقتها الأولى في السوق عام 1961. هذا الكمبيوتر المبكر، الذي تم تطويره قبل 20 عامًا تقريبًا من إدخال أول كمبيوتر شخصي من آي بي إم في عام 1981، كان قادرًا على التعرف على 16 كلمة منطوقة وعلى الأرقام من 0 إلى 9.
تم تطوير أول برنامج كمبيوتر لمعالجة اللغة الطبيعية أو روبوت الدردشة إليزا بواسطة الأستاذ جوزيف وايزنباوم في معهد ماساتشوستس للتكنولوجيا في الستينيات. تم إنشاؤه لـ«إثبات أن الاتصال بين الإنسان والآلة كان سطحيًا».[6] استخدمت إليزا منهجية مطابقة الأنماط والاستبدال في الاستجابات النصية لمحاكاة المحادثة، مما أعطى وهمًا بالفهم من جانب البرنامج.
وبحسب ما ورد طلبت سكرتيرة وايزنباوم الخاصة من وايزنباوم مغادرة الغرفة حتى تتمكن هي وإليزا من إجراء محادثة حقيقية. تفاجأ وايزنباوم بهذا، وكتب لاحقًا: «لم أدرك... أن التعرض القصير للغاية لبرنامج كمبيوتر بسيط نسبيًا يمكن أن يحفز التفكير الوهمي القوي لدى الأشخاص العاديين تمامًا».[7]
أُعطى هذا اسمًا لتأثير إليزا، والميل إلى افتراض أن سلوكيات الكمبيوتر دون وعي تشبه السلوكيات البشرية؛ وهذا هو، التجسيم، وهي ظاهرة موجودة في التفاعلات البشرية مع المساعدين الافتراضيين.
تم تحقيق المَعلم التالي في تطوير تقنية التعرف على الصوت في السبعينيات في جامعة كارنيجي ميلون في بيتسبرغ، بنسلفانيا بدعم كبير من وزارة الدفاع الأمريكية ووكالة داربا التابعة لها، بتمويل خمس سنوات من برنامج أبحاث فهم الكلام، بهدف للوصول إلى الحد الأدنى من المفردات البالغ 1000 كلمة. وشاركت في البرنامج شركات وأوساط أكاديمية بما في ذلك آي بي إم وجامعة كارنيجي ميلون (CMU) ومعهد ستانفورد للأبحاث.
وكانت النتيجة هي «هاربي»، التي أتقنت حوالي 1000 كلمة، مفردات طفل يبلغ من العمر ثلاث سنوات، ويمكنها فهم الجمل. كما يمكنها معالجة الكلام الذي يتبع المفردات المبرمجة مسبقًا، والنطق، والهياكل النحوية لتحديد تسلسل الكلمات المنطقي معًا، وبالتالي تقليل أخطاء التعرف على الكلام.
في عام 1986، كانت Tangora عبارة عن ترقية لـ Shoebox، كانت آلة كاتبة تتعرف على الصوت. تم تسميتها على اسم أسرع كاتب في العالم في ذلك الوقت، وكان يحتوي على مفردات 20000 كلمة واستخدم التنبؤ لتحديد النتيجة الأكثر احتمالية بناءً على ما قيل في الماضي. اعتمد نهج آي بي إم على نموذج نظرية ماركوف المخفية، والذي يضيف إحصائيات لتقنيات معالجة الإشارات الرقمية. تجعل هذه الطريقة من الممكن التنبؤ بأكثر الأصوات احتمالية لاتباع صوت معين. لا يزال يتعين على كل متحدث تدريب الآلة الكاتبة بشكل فردي على التعرف على صوته أو صوتها والتوقف بين كل كلمة.
ولادة المساعدين الافتراضيين الأذكياء: 1990 - حتى الآن
عدلأصبحت تقنية التعرف على الكلام الرقمي في التسعينيات من سمات الكمبيوتر الشخصي مع قتال آي بي إم وفيليبس وLemout & Hauspie من أجل العملاء. بعد ذلك بكثير، وضع إطلاق أول هاتف ذكي المعروف بآي بي إم سمون في عام 1994 الأساس لمساعدين افتراضيين أذكياء كما نعرفهم اليوم.
في عام 1997، تمكن برنامج Dragon's Naturally Speaking من التعرف على الكلام البشري الطبيعي ونسخه دون توقف بين كل كلمة في مستند بمعدل 100 كلمة في الدقيقة. لا يزال إصدار Naturally Speaking متاحًا للتنزيل ولا يزال يستخدم حتى اليوم، على سبيل المثال، من قبل العديد من الأطباء في الولايات المتحدة والمملكة المتحدة لتوثيق سجلاتهم الطبية.
في عام 2001، أطلق Colloquis علنًا SmarterChild، على منصات مثل AIM وMSN Messenger. بينما كان SmarterChild المستند إلى النصوص بالكامل قادرًا على ممارسة الألعاب والتحقق من الطقس والبحث عن الحقائق والتحدث مع المستخدمين إلى حد ما.[8]
كان أول مساعد افتراضي رقمي حديث مثبت على هاتف ذكي هو سيري، والذي تم تقديمه كميزة لجهاز iPhone 4S في 4 أكتوبر 2011.[9] طورت شركة أبل. سيري بعد استحواذها عام 2010 على Siri Inc. ، وهي فرع من SRI International، وهو معهد أبحاث تموله داربا ووزارة الدفاع الأمريكية.[10] كان هدفه المساعدة في مهام مثل إرسال رسالة نصية أو إجراء مكالمات هاتفية أو التحقق من الطقس أو إعداد منبه. بمرور الوقت، تم تطويره لتقديم توصيات المطاعم والبحث في الإنترنت وتقديم اتجاهات القيادة.
في نوفمبر 2014، أعلنت أمازون عن أليكسا بجانب Echo.
في أبريل 2017، أصدرت أمازون خدمة لبناء واجهات محادثة لأي نوع من المساعديين الافتراضين أو الواجهة.
طريقة التفاعل
عدليعمل المساعدون الافتراضيون عبر:
- النص، بما في ذلك: الدردشة على شبكة الإنترنت (وخاصة في الرسائل الفورية التطبيق أو غيرها من التطبيق)، نص SMS، البريد الإلكتروني أو غيرها من قنوات الاتصال المستندة إلى نص، على سبيل المثال Conversica الصورة مساعدين الظاهري الذكي للأعمال التجارية.[11]
- الصوت، على سبيل المثال مع أمازون أليكسا [12] على جهاز Amazon Echo أو سيري على iPhone أو مساعد جوجل على الأجهزة المحمولة التي تدعم Google / Android
- عن طريق التقاط و/أو تحميل الصور، كما في حالة Samsung Bixby على Samsung Galaxy S8
يمكن الوصول إلى بعض المساعدين الافتراضيين عبر طرق متعددة، مثل مساعد جوجل عبر الدردشة على Google Allo وتطبيق Google Messages وعبر الصوت على مكبرات الصوت الذكية Google Home .
يستخدم المساعدون الافتراضيون معالجة اللغة الطبيعية (NLP) لمطابقة نص المستخدم أو الإدخال الصوتي مع الأوامر القابلة للتنفيذ. يتعلم الكثير باستمرار باستخدام تقنيات الذكاء الاصطناعي بما في ذلك التعلم الآلي. يتمتع بعض هؤلاء المساعدين مثل مساعد جوجل (الذي يحتوي على جوجل لنس) و Samsung Bixby أيضًا بالقدرة الإضافية على إجراء معالجة الصور للتعرف على الكائنات الموجودة في الصورة لمساعدة المستخدمين في الحصول على نتائج أفضل من الصور التي تم النقر عليها.
لتنشيط مساعد افتراضي باستخدام الصوت، يمكن استخدام كلمة تنبيه. هذه كلمة أو مجموعات كلمات مثل "Hey Siri" و "OK Google" أو "Hey Google" و «أليكسا» و "Hey Microsoft".[13] نظرًا لأن المساعدين الافتراضيين أصبحوا أكثر شيوعًا، فهناك مخاطر قانونية متزايدة.[14]
وجود الأجهزة والكائنات
عدليمكن دمج المساعدين الافتراضيين في العديد من أنواع المنصات أو، مثل أمازون أليكسا، عبر العديد منها:
- في أجهزة مثل مكبرات الصوت الذكية مثل Amazon Echo و Google Home وApple HomePod
- في تطبيقات المراسلة الفورية على كل من الهواتف الذكية وعبر الويب، على سبيل المثال Facebook M (المساعد الافتراضي) على كل من تطبيقات Facebook وFacebook Messenger أو عبر الويب
- مدمج في نظام تشغيل الهاتف المحمول (OS)، كما هو الحال مع سيريمن Apple على أجهزة iOS و BlackBerry Assistant على أجهزة BlackBerry 10، أو في نظام تشغيل سطح المكتب مثل كورتانا على نظام التشغيل Microsoft Windows OS
- مدمج في هاتف ذكي مستقل عن نظام التشغيل، كما هو الحال مع Bixby في Samsung Galaxy S8 وNote 8.[15]
- ضمن منصات المراسلة الفورية، المساعدون من منظمات محددة، مثل Aerobot التابع لشركة Aeromexico على Facebook Messenger أو Wechat Secretary على WeChat
- داخل تطبيقات الأجهزة المحمولة من شركات معينة ومؤسسات أخرى، مثل Dom from Domino's Pizza [16]
- في الأجهزة[17] والسيارات[18] والتكنولوجيا القابلة للارتداء.[19]
- غالبًا ما عملت الأجيال السابقة من المساعدين الظاهريين على مواقع الويب، مثل Ask Jenn التابعة لخطوط ألاسكا الجوية[20] أو على أنظمة الاستجابة الصوتية التفاعلية (IVR) مثل American Airlines 'IVR by Nuance .
الخدمات
عدليمكن للمساعدين الافتراضيين تقديم مجموعة متنوعة من الخدمات. وتشمل هذه الخدمات على:[21]
- تقديم معلومات مثل الطقس والحقائق من على سبيل المثال ويكبيديا أو IMDb، ضبط المنبه، والقيام بعمل قوائم المهام وقوائم التسوق
- تشغيل الموسيقى من خدمات البث مثل Spotify وPandora؛ تشغيل محطات الراديو قراءة الكتب المسموعة
- قتشغيل مقاطع الفيديو أو البرامج التلفزيونية أو الأفلام على أجهزة التلفزيون، والبث من على سبيل المثال نيتفليكس
- تجارة المحادثة (انظر أدناه)
- مساعدة التفاعل العام مع الحكومة (انظر الذكاء الاصطناعي في الحكومة)
- استكمال و/أو استبدال خدمة العملاء بالبشر.[22] قدر أحد التقارير أن مساعدًا آليًا عبر الإنترنت أنتج انخفاضًا بنسبة 30٪ في عبء العمل لمركز اتصال يوفره الإنسان.[23]
تجارة المحادثة
عدلالتجارة التحادثية هي تجارة إلكترونية عبر وسائل مختلفة للمراسلة، بما في ذلك عبر المساعدين الصوتيين[24] ولكن أيضًا الدردشة الحية على مواقع التجارة الإلكترونية على الويب، والدردشة الحية على تطبيقات المراسلة مثل وي تشات وفيسبوك ماسنجر وواتساب[25] وروبوتات الدردشة على المراسلة تطبيقات أو مواقع الويب.
دعم العملاء
عدليمكن للمساعد الإفتراضي العمل مع فريق دعم العملاء في الشركة لتقديم دعم على مدار الساعة طوال أيام الأسبوع للعملاء. يوفر استجابات سريعة، مما يعزز تجربة العميل.
خدمات الطرف الثالث
عدلتعمل أمازون على تمكين «مهارات» أليكسا و «إجراءات» جوجل، وهي في الأساس تطبيقات تعمل على منصات المساعدة.
خصوصية المساعد الظاهري
عدلالمساعدين الافتراضيين لديهم مجموعة متنوعة من مخاوف الخصوصية المرتبطة بهم. تشكل الميزات مثل التنشيط الصوتي تهديدًا، حيث تتطلب هذه الميزات أن يكون الجهاز دائمًا مستمعًا.[26] تم اقتراح أنماط الخصوصية مثل زر الأمان الظاهري لإنشاء مصادقة متعددة الطبقات للمساعدين الظاهريين.[27]
سياسة الخصوصية للمساعدين الظاهريين البارزين
عدلمساعد جوجل
عدللا يقوم مساعد جوجل بتخزين بياناتك دون إذنك. لتخزين الصوت، يمكنك الانتقال إلى الصوت ونشاط الصوت (VAA) وتشغيل هذه الميزة. يتم إرسال ملفاتك الصوتية إلى السحابة واستخدامها من قبل جوجل لتحسين أداء مساعد جوجل، ولكن فقط إذا قمت بتشغيل ميزة VAA.[28]
أمازون أليكسا
عدليستمع المساعد الافتراضي أليكسا من أمازون إلى محادثتك فقط عند استخدام كلمة التنبيه (مثل Alexa و Amazon و Echo). يبدأ تسجيل المحادثة بعد نداء كلمة تنبيه. يتوقف عن الاستماع بعد 8 ثوانٍ من الصمت. يرسل المحادثة المسجلة إلى السحابة. يمكنك حذف التسجيل الخاص بك من السحابة عن طريق زيارة "Alexa Privacy" في "Alexa". يمكنك منع أليكسا من الاستماع إلى محادثاتك باستخدام ميزة «كتم الصوت» في أليكسا، بعد كتم صوت الجهاز، لا يمكنه الاستماع إليك حتى إذا كنت تستخدم كلمات التنبيه (مثل Alexa). [29]
سيري
عدللا تقوم أبل بتسجيل الصوت الخاص بك لتحسين سيري، بل تستخدم النصوص بدلاً من ذلك. يرسل فقط البيانات المهمة للتحليل، على سبيل المثال، إذا طلبت من سيري قراءة رسالتك، فلن ترسل الرسالة إلى السحابة، وسيقوم الجهاز بقراءة الرسالة مباشرة دون تدخل الخادم. يمكن للمستخدمين إلغاء الاشتراك في أي وقت إذا كانوا لا يريدون من سيري إرسال النصوص في السحابة.[30]
الاهتمام المفترض والملاحظ للمستهلك
عدلالقيمة المضافة المفترضة تتيح طريقة جديدة للتفاعل
عدليمكن أن تأتي القيمة المضافة للمساعدين الافتراضيين من بين أمور أخرى مما يلي:
- يمكن أن يمثل الاتصال الصوتي أحيانًا الاتصال الأمثل بين الإنسان والآلة:
- الملائمة: هناك بعض القطاعات حيث يكون الصوت هو الطريقة الوحيدة للتواصل الممكن، وبشكل أكثر عمومية، فهو يسمح بتحرير اليدين والرؤية بشكل محتمل للقيام بنشاط آخر بالتوازي، أو يساعد أيضًا الأشخاص ذوي الإعاقة.
- السرعة: الصوت أكثر فعالية من الكتابة على لوحة المفاتيح: يمكننا التحدث حتى 200 كلمة في الدقيقة مقابل 60 كلمة في حالة الكتابة على لوحة المفاتيح. كما أنه أكثر طبيعية وبالتالي يتطلب جهدًا أقل (قراءة النص يمكن أن تصل إلى 700 كلمة في الدقيقة).[31]
- يوفر المساعدون الافتراضيون الكثير من الوقت عن طريق الأتمتة: يمكنهم أخذ المواعيد أو قراءة الأخبار بينما يقوم المستهلك بعمل شيء آخر. من الممكن أيضًا أن تطلب من المساعد الافتراضي جدولة الاجتماعات، وبالتالي المساعدة في تنظيم الوقت. أوضح مصممو المجدولين الرقميين الجدد طموحهم في أن تكون هذه التقاويم على قيد الحياة لجعل المستهلك يستخدم وقته بشكل أكثر كفاءة، من خلال عمليات التعلم الآلي، والتنظيم الكامل لوقت العمل ووقت الفراغ. كمثال عندما يعبر المستهلك عن رغبته في جدولة استراحة، فإن VA ستحدده في اللحظة المثلى لهذا الغرض (على سبيل المثال في وقت من الأسبوع حيث يكونون أقل إنتاجية)، مع الهدف الإضافي طويل الأجل المتمثل في قادر على جدولة وتنظيم وقت الفراغ للمستهلك، لضمان كفاءة العمل المثلى لهم.[32]
الفائدة المتصورة
عدل- وفقًا لدراسة حديثة (2019)، فإن السببين لاستخدام المساعدين الافتراضيين للمستهلكين هما الفائدة المتصورة والمتعة المتصورة. النتيجة الأولى لهذه الدراسة هي أن كلاً من الفائدة المتصورة والمتعة المتصورة لهما تأثير قوي مكافئ على رغبة المستهلك في استخدام المساعد الافتراضي.
- النتيجة الثانية لهذه الدراسة هي أن:
- جودة المحتوى المقدمة لها تأثير قوي للغاية على الفائدة المتصورة وتأثير قوي على التمتع المتصور.
- الجاذبية البصرية لها تأثير قوي للغاية على التمتع المتصور.
- الأتمتة لها تأثير قوي على الفائدة المتصورة.[33]
خلافات الذكاء الاصطناعي
عدل- يحفز المساعدون الافتراضيون فقاعة التصفية: بالنسبة إلى وسائل التواصل الاجتماعي، يتم تدريب خوارزميات المساعدين الظاهريين على إظهار البيانات ذات الصلة وتجاهل البيانات الأخرى بناءً على الأنشطة السابقة للمستخدم كون البيانات ذات الصلة هي التي ستثير اهتمام المستخدم أو ترضيه. ونتيجة لذلك، يصبح المستخدمون معزولين عن البيانات التي لا تتفق مع وجهات نظرهم، مما يعزلهم بشكل فعال في فقاعتهم الفكرية الخاصة، ويعززون آرائهم. عُرف عن هذه الظاهرة أنها تعزز الأخبار المزيفة وغرف الصدى.[34]
- يتم أحيانًا انتقاد المساعدين الافتراضيون لكونهم مبالغًا في تقديرهم. على وجه الخصوص، يشير A. Casilli إلى أن الذكاء الاصطناعي للمساعدات الافتراضية ليس ذكيًا ولا مصطنعًا لسببين:
- ليسوا أذكياء لأن كل ما يفعلونه هو كونهم مساعدًا للإنسان، وفقط من خلال القيام بالمهام التي يمكن للإنسان القيام بها بسهولة، وفي نطاق محدود جدًا من الإجراءات: العثور على المعلومات أو العروض أو المستندات وتصنيفها وتقديمها. أيضًا، لا يستطيع المساعدون الافتراضيون اتخاذ القرارات بمفردهم أو توقع الأشياء.
- وليسوا مصطنعين لأن عملهم مستحيل بدون تصنيف بشري من خلال العمل الجزئي.[35]
الآثار الأخلاقية
عدلفي عام 2019 انتقد أنطونيو أ.كاسيلي، عالم الاجتماع الفرنسي، الذكاء الاصطناعي والمساعدين الافتراضيين على وجه الخصوص بالطريقة التالية:
في المستوى الأول، حقيقة أن المستهلك يوفر بيانات مجانية لتدريب وتحسين المساعد الافتراضي، غالبًا دون معرفة ذلك، أمر مزعج من الناحية الأخلاقية.
ولكن في المستوى الثاني، قد يكون الأمر مزعجًا أكثر من الناحية الأخلاقية لمعرفة كيفية تدريب أنظمة الذكاء الاصطناعي هذه على هذه البيانات.
يتم تدريب هذا الذكاء الاصطناعي عبر الشبكات العصبية، والتي تتطلب كمية هائلة من البيانات المصنفة. ومع ذلك، يجب تسمية هذه البيانات من خلال عملية بشرية، وهو ما يفسر ظهور الأعمال الصغيرة في العقد الماضي. وهذا يعني، استخدام بعض الأشخاص في جميع أنحاء العالم عن بُعد للقيام ببعض المهام المتكررة والبسيطة جدًا مقابل بضعة سنتات، مثل الاستماع إلى بيانات الكلام في المساعد الإفتراضي وتدوين ما قيل. تعرضت شركة Microwork لانتقادات بسبب انعدام الأمن الوظيفي الذي تسببه، وبسبب الافتقار التام إلى التنظيم: كان متوسط الراتب 1,38 دولارًا / ساعة في عام 2010،[36] ولا يوفر مزايا الرعاية الصحية ولا مزايا التقاعد والأجر المرضي والحد الأدنى للأجور. بالتالي، فإن المساعدين الافتراضيين ومصمميهم مثيرون للجدل لإثارة انعدام الأمن الوظيفي، والذكاء الاصطناعي الذي يقترحونه لا يزال بشريًا بطريقة سيكون بها مستحيلا بدون العمل الصغير لملايين العاملين البشريين.[35]
تثار مخاوف الخصوصية من خلال حقيقة أن الأوامر الصوتية متاحة لموفري المساعدين الظاهريين في شكل غير مشفر، وبالتالي يمكن مشاركتها مع أطراف ثالثة ومعالجتها بطريقة غير مصرح بها أو غير متوقعة.[37] بالإضافة إلى المحتوى اللغوي للكلام المسجل، يمكن أن تحتوي طريقة تعبير المستخدم وخصائصه الصوتية ضمنيًا على معلومات حول هويته أو هويتها البيومترية، وسمات الشخصية وشكل الجسم وحالة الصحة البدنية والعقلية والجنس والحالات المزاجية والعواطف والحالة الاجتماعية والاقتصادية والأصل الجغرافي.[38]
منصات المطورين
عدلتشمل منصات المطورين البارزة للمساعدين الافتراضيين ما يلي:
- تم فتح Amazon Lex للمطورين في أبريل 2017. تتضمن تقنية فهم اللغة الطبيعية جنبًا إلى جنب مع التعرف التلقائي على الكلام وتم تقديمها في نوفمبر 2016.[39]
- توفر جوجل الإجراءات على جوجل ومنصات Dialogflow للمطورين لإنشاء «إجراءات» لمساعد جوجل.[40]
- توفر Apple SiriKit للمطورين لإنشاء ملحقات لسيري
- واتسون من شركة آي بي إم، على الرغم من الحديث عنه في بعض الأحيان كمساعد افتراضي، فهو في الواقع نظام أساسي كامل للذكاء الاصطناعي ومجتمع يدعم بعض المساعدين الافتراضيين وروبوتات المحادثة والعديد من أنواع الحلول الأخرى.[41] [42]
الأجيال السابقة
عدلفي الأجيال السابقة من المساعدين الافتراضيين المستندين إلى الدردشة النصية، غالبًا ما كان يتم تمثيل المساعد بواسطة صورة رمزية (تُعرف أيضًا بشخصية تفاعلية عبر الإنترنت أو شخصية آلية) - كان هذا يُعرف باسم الوكيل المتجسد .
مقارنة المساعدين البارزين
عدلالأهمية الاقتصادية
عدلللأفراد
عدلتعتبر التجارب الرقمية التي تم تمكينها بواسطة المساعدين الافتراضيين من بين التطورات التكنولوجية الحديثة الرئيسية واتجاهات المستهلك الواعدة. يدعي الخبراء أن التجارب الرقمية ستحقق ثقلًا للوضع يمكن مقارنته بالتجارب «الحقيقية»، إذا لم تصبح أكثر طلبًا وقيمة.[43] تم التحقق من هذا الاتجاه من خلال عدد كبير من المستخدمين المتكررين والنمو الكبير في أعداد المستخدمين العالميين للمساعدين الرقميين الظاهريين. في منتصف عام 2017، يقدر عدد المستخدمين المتكررين للمساعدين الافتراضيين الرقميين بحوالي مليار في جميع أنحاء العالم.[44] بالإضافة إلى ذلك، يمكن ملاحظة أن تقنية المساعد الرقمي الافتراضي لم تعد مقتصرة على تطبيقات الهواتف الذكية، ولكنها موجودة في العديد من قطاعات الصناعة (بما في ذلك السيارات والاتصالات والبيع بالتجزئة والرعاية الصحية والتعليم).[45] استجابةً لنفقات البحث والتطوير الكبيرة للشركات في جميع القطاعات والتنفيذ المتزايد للأجهزة المحمولة، من المتوقع أن ينمو سوق تقنية التعرف على الكلام بمعدل نمو سنوي مركب يبلغ 34.9٪ على مستوى العالم خلال الفترة من 2016 إلى 2024 وبالتالي يتجاوز السوق العالمي حجم 7.5 مليار دولار أمريكي بحلول عام 2024. وفقًا لدراسة أجرتها شركة Ovum، من المتوقع أن تتجاوز «القاعدة المثبتة للمساعد الرقمي الأصلي» سكان العالم بحلول عام 2021، مع 7.5 مليار جهاز صوتي نشط قادر على استخدام الذكاء الاصطناعي.[46] وفقًا لـ Ovum، بحلول ذلك الوقت، «سيهيمن مساعد جوجل على سوق الأجهزة التي تدعم الذكاء الاصطناعي الصوتي بنسبة 23.3٪ من حصة السوق، يليه Bixby من سامسونج (14.5٪)، وسيري من أبل (13.1٪)، وأليكسا من أمازون (3.9٪)، ومايكروسوفت كورتانا (2.3٪)».
مع الأخذ في الاعتبار التوزيع الإقليمي لقادة السوق، من المتوقع أن تهيمن شركات أمريكا الشمالية (على سبيل المثال Nuance Communications وIBM و eGain) على الصناعة على مدار السنوات القادمة، نظرًا للتأثير الكبير لـ BYOD (أحضر جهازك الخاص) ونماذج أعمال التنقل الخاصة بالمؤسسات. علاوة على ذلك، من المتوقع أن يؤدي الطلب المتزايد على المنصات التي تدعم الهواتف الذكية إلى تعزيز نمو صناعة المساعد الافتراضي الذكي (IVA) في أمريكا الشمالية. على الرغم من حجمها الأصغر مقارنة بسوق أمريكا الشمالية، فمن المتوقع أن تنمو صناعة المساعد الافتراضي الذكي من منطقة آسيا والمحيط الهادئ، مع وجود لاعبين رئيسيين في الهند والصين، بمعدل نمو سنوي يبلغ 40٪ (أعلى من المتوسط العالمي) خلال الفترة من 2016 إلى 2024.[45]
فرصة اقتصادية للمؤسسات
عدللا ينبغي النظر إلى المساعدين الافتراضيين كأداة للأفراد فقط، حيث يمكن أن يكون لديهم فائدة اقتصادية حقيقية للمؤسسات. على سبيل المثال، يمكن أن يقوم المساعد الافتراضي بدور المساعد المتاح دائمًا بمعرفة موسوعية. والتي يمكنها تنظيم الاجتماعات والتحقق من قوائم الجرد والتحقق من المعلومات. يعتبر المساعدون الافتراضيون أكثر أهمية ودمجهم في المؤسسات الصغيرة والمتوسطة الحجم غالبًا ما يتكون من خطوة أولى سهلة من خلال المزيد من التكيف العالمي واستخدام إنترنت الأشياء (IoT). في الواقع، تُدرك الشركات الصغيرة والمتوسطة الحجم تقنيات إنترنت الأشياء على أنها تقنيات ذات أهمية بالغة، ولكنها معقدة للغاية أو محفوفة بالمخاطر أو باهظة التكلفة لاستخدامها.[47]
الأمان
عدلفي مايو 2018، نشر باحثون من جامعة كاليفورنيا في بيركلي ورقة بحثية أظهرت أن الأوامر الصوتية التي لا يمكن اكتشافها للأذن البشرية يمكن دمجها مباشرة في الموسيقى أو النص المنطوق، وبالتالي التلاعب بالمساعدين الافتراضيين لأداء إجراءات معينة دون أن يلاحظ المستخدم ذلك.[48] قام الباحثون بإجراء تغييرات طفيفة على الملفات الصوتية، والتي ألغت أنماط الصوت التي تهدف أنظمة التعرف على الكلام إلى اكتشافها. تم استبدالها بأصوات يمكن للنظام تفسيرها بشكل مختلف وتطلب منه الاتصال بأرقام الهواتف أو فتح مواقع الويب أو حتى تحويل الأموال. يُعرف احتمال حدوث ذلك منذ عام 2016، ويؤثر على أجهزة من أبل وأمازون وجوجل.[49]
بالإضافة إلى الإجراءات غير المقصودة والتسجيل الصوتي، هناك مخاطر أخرى تتعلق بالأمان والخصوصية مرتبطة بالمساعدين الافتراضيين الأذكياء وهي الأوامر الصوتية الخبيثة: المهاجم الذي ينتحل شخصية مستخدم ويصدر أوامر صوتية ضارة، على سبيل المثال، لفتح باب ذكي للحصول على دخول غير مصرح به إلى المنزل أو المرآب أو طلب العناصر عبر الإنترنت دون علم المستخدم. على الرغم من أن بعض المساعدين الافتراضيين يقومون بتوفير ميزة تدريب صوتي لمنع مثل هذا الانتحال، فقد يكون من الصعب على النظام التمييز بين الأصوات المتشابهة. وبالتالي، قد يتمكن الشخص الخبيث القادر على الوصول إلى جهاز يدعم المساعد الإفتراضي من خداع النظام ليعتقد أنه المالك الحقيقي ويقوم بأعمال إجرامية أو مؤذية.[50]
انظر أيضًا
عدل- تطبيقات الذكاء الاصطناعي
- روبوت الدردشة
- واجهة مستخدم تحادثية
- الرسوم المتحركة للوجه بالكمبيوتر
- نظام خبير
- شبكة منزلية
- وكيل ذكي
- ملاح المعرفة
- مساعد مايكروسوفت أوفيس
- معالجة اللغة الطبيعية
- محاكاة الواقع
- وكيل برمجيات
- مساعد الإعداد (برنامج)
المراجع
عدل- ^ Hoy، Matthew B. (2018). "Alexa, Siri, Cortana, and More: An Introduction to Voice Assistants". Medical Reference Services Quarterly. ج. 37 ع. 1: 81–88. DOI:10.1080/02763869.2018.1404391. PMID:29327988.
- ^ Klüwer, Tina. "From chatbots to dialog systems." Conversational agents and natural language interaction: Techniques and Effective Practices. IGI Global, 2011. 1–22.
- ^ Daniel B. Kline (30 يناير 2017). "Alexa, How Big Is Amazon's Echo?". The Motley Fool. مؤرشف من الأصل في 2020-07-26.
- ^ Krazit, Tom. "Google finding its voice". CNET (بالإنجليزية). Archived from the original on 2021-01-05. Retrieved 2020-10-23.
- ^ Moskvitch, Katia. "The machines that learned to listen". www.bbc.com (بالإنجليزية). Archived from the original on 2020-12-31. Retrieved 2020-05-05.
- ^ Epstein, J; Klinkenberg, W. D (1 May 2001). "From Eliza to Internet: a brief history of computerized assessment". Computers in Human Behavior (بالإنجليزية). 17 (3): 295–314. DOI:10.1016/S0747-5632(01)00004-8. ISSN:0747-5632. Archived from the original on 2020-06-11.
- ^ Weizenbaum، Joseph (1976). Computer power and human reason : from judgment to calculation. Oliver Wendell Holmes Library Phillips Academy. San Francisco : W. H. Freeman. مؤرشف من الأصل في 2021-03-07.
- ^ "Smartphone: your new personal assistant – Orange Pop". 10 يوليو 2017. مؤرشف من الأصل في 2017-07-10. اطلع عليه بتاريخ 2020-05-05.
- ^ Darren Murph (4 أكتوبر 2011). "iPhone 4S hands-on!". Engadget.com. مؤرشف من الأصل في 2021-01-26. اطلع عليه بتاريخ 2017-12-10.
- ^ "Feature: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung – WELT" [From IBM Shoebox to Siri: 50 years of speech recognition]. Die Welt (بالألمانية). Welt.de. 20 Apr 2012. Archived from the original on 2020-09-24. Retrieved 2017-12-10.
- ^ "Conversica Raises $31 Million in Series C Funding to Fuel Expansion of Conversational AI for Business". Bloomberg.com (بالإنجليزية). 30 Oct 2018. Archived from the original on 2019-10-14. Retrieved 2020-10-23.
- ^ Herrera, Sebastian. "Amazon Extends Alexa's Reach Into Wearables". WSJ (بالإنجليزية الأمريكية). Archived from the original on 2020-09-08. Retrieved 2019-09-26.
- ^ "S7617 – Developing Your Own Wake Word Engine Just Like 'Alexa' and 'OK Google'". GPU Technology Conference. مؤرشف من الأصل في 2020-11-30. اطلع عليه بتاريخ 2017-07-17.
- ^ Van Loo، Rory (1 مارس 2019). "Digital Market Perfection". Michigan Law Review. ج. 117 ع. 5: 815. مؤرشف من الأصل في 2021-01-26.
- ^ Lynn La (27 فبراير 2017). "Everything Google Assistant can do on the Pixel". CNET. مؤرشف من الأصل في 2021-01-18. اطلع عليه بتاريخ 2017-12-10.
- ^ Morrison، Maureen (5 أكتوبر 2014). "Domino's Pitches Voice-Ordering App in Fast-Food First | CMO Strategy". AdAge. مؤرشف من الأصل في 2020-08-17. اطلع عليه بتاريخ 2017-12-10.
- ^ Dan O'Shea (4 يناير 2017). "LG introduces smart refrigerator with Amazon Alexa-enabled grocery ordering". Retail Dive. مؤرشف من الأصل في 2020-08-07. اطلع عليه بتاريخ 2017-12-10.
{{استشهاد ويب}}
: صيانة الاستشهاد: أسماء عددية: قائمة المؤلفين (link) صيانة الاستشهاد: أسماء متعددة: قائمة المؤلفين (link) - ^ Samuel Gibbs (7 فبراير 2017). "Amazon's Alexa escapes the Echo and gets into cars | Technology". The Guardian. مؤرشف من الأصل في 2020-11-12. اطلع عليه بتاريخ 2017-12-10.
- ^ "What is Google Assistant, how does it work, and which devices offer it?". Pocket-lint. 6 أكتوبر 2017. مؤرشف من الأصل في 2020-10-31. اطلع عليه بتاريخ 2017-12-10.
- ^ ""Ask Jenn", Alaska Airlines website". Alaskaair.com. 2 يناير 2017. مؤرشف من الأصل في 2020-07-30. اطلع عليه بتاريخ 2017-12-10.
- ^ Taylor Martin؛ David Priest (10 سبتمبر 2017). "The complete list of Alexa commands so far". CNET. مؤرشف من الأصل في 2020-12-30. اطلع عليه بتاريخ 2017-12-10.
- ^ Kongthon، Alisa؛ Sangkeettrakarn، Chatchawal؛ Kongyoung، Sarawoot؛ Haruechaiyasak، Choochart (1 يناير 2009). Implementing an Online Help Desk System Based on Conversational Agent. MEDES '09. New York, NY, USA: ACM. ص. 69:450–69:451. DOI:10.1145/1643823.1643908. ISBN:9781605588292.
{{استشهاد بكتاب}}
:|عمل=
تُجوهل (مساعدة) - ^ Anthony O'Donnell (3 يونيو 2010). "Aetna's new "virtual online assistant"". Insurance & Technology. مؤرشف من الأصل في 2010-06-07.
- ^ "How to prepare your products and brand for conversational commerce". 6 مارس 2018. مؤرشف من الأصل في 2020-09-29.
- ^ Taylor، Glenn. "Retail's Big Opportunity: 87% Of U.S. Consumers Grasp The Power Of Conversational Commerce – Retail TouchPoints". مؤرشف من الأصل في 2020-08-04.
- ^ Zhang، Guoming؛ Yan، Chen؛ Ji، Xiaoyu؛ Zhang، Tianchen؛ Zhang، Taimin؛ Xu، Wenyuan (2017). "DolphinAttack". Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security - CCS '17. ص. 103–117. arXiv:1708.09537. DOI:10.1145/3133956.3134052. ISBN:9781450349468.
- ^ Lei. "The Insecurity of Home Digital Voice Assistants – Amazon Alexa as a Case Study".
{{استشهاد بأرخايف}}
: الوسيط|arxiv=
مطلوب (مساعدة) - ^ "Doing more to protect your privacy with the Assistant". Google (بالإنجليزية). 23 Sep 2019. Archived from the original on 2020-12-12. Retrieved 2020-02-27.
- ^ "Amazon.com Help: Alexa, Echo Devices, and Your Privacy". www.amazon.com. مؤرشف من الأصل في 2021-01-26. اطلع عليه بتاريخ 2020-02-27.
- ^ "Improving Siri's privacy protections". Apple Newsroom (بIndian English). Archived from the original on 2020-09-09. Retrieved 2020-02-27.
- ^ Minker، W.؛ Néel، F. (2002). "Développement des technologies vocales". Le Travail Humain. ج. 65 ع. 3: 261. DOI:10.3917/th.653.0261. ISSN:0041-1868.
- ^ Wajcman، Judy (2019). "The Digital Architecture of time Management" (PDF). Science, Technology, & Human Values. ج. 44 ع. 2: 315–337. DOI:10.1177/0162243918795041. مؤرشف من الأصل (PDF) في 2020-11-26.
- ^ Yang، Heetae؛ Lee، Hwansoo (26 يونيو 2018). "Understanding user behavior of virtual personal assistant devices". Information Systems and E-Business Management. ج. 17 ع. 1: 65–87. DOI:10.1007/s10257-018-0375-1. ISSN:1617-9846.
- ^ Tisseron، Serge (2019). "La famille sous écoute". L'École des Parents. n° 632 ع. 3: 16. DOI:10.3917/epar.632.0016. ISSN:0424-2238.
{{استشهاد بدورية محكمة}}
:|المجلد=
يحوي نصًّا زائدًا (مساعدة) - ^ ا ب Casilli, Antonio A. (2019). En attendant les robots. Enquête sur le travail du clic. Editions Seuil. ISBN:978-2-02-140188-2. OCLC:1083583353.
- ^ Horton، John Joseph؛ Chilton، Lydia B. (2010). "The labor economics of paid crowdsourcing". ACM Press. New York, New York, USA: 209. DOI:10.1145/1807342.1807376. ISBN:978-1-60558-822-3.
- ^ "Apple, Google, and Amazon May Have Violated Your Privacy by Reviewing Digital Assistant Commands". Fortune. 5 أغسطس 2019. مؤرشف من الأصل في 2020-11-27. اطلع عليه بتاريخ 2020-05-13.
- ^ Kröger، Jacob Leon؛ Lutz، Otto Hans-Martin؛ Raschke، Philip (2020). "Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference". ج. 576: 242–258. DOI:10.1007/978-3-030-42504-3_16. ISSN:1868-4238.
{{استشهاد بدورية محكمة}}
: الاستشهاد بدورية محكمة يطلب|دورية محكمة=
(مساعدة) - ^ "Amazon Lex, the technology behind Alexa, opens up to developers". TechCrunch. 20 أبريل 2017. مؤرشف من الأصل في 2020-11-11. اطلع عليه بتاريخ 2017-12-10.
- ^ "Actions on Google | Google Developers". مؤرشف من الأصل في 2021-01-27. اطلع عليه بتاريخ 2017-12-10.
- ^ "Watson – Stories of how AI and Watson are transforming business and our world". Ibm.com. مؤرشف من الأصل في 2021-02-01. اطلع عليه بتاريخ 2017-12-10.
- ^ Memeti، Suejb؛ Pllana، Sabri (يناير 2018). "PAPA: A parallel programming assistant powered by IBM Watson cognitive computing technology". Journal of Computational Science. ج. 26: 275–284. DOI:10.1016/j.jocs.2018.01.001.
- ^ "5 Consumer Trends for 2017". TrendWatching. 31 أكتوبر 2016. مؤرشف من الأصل في 2021-01-21. اطلع عليه بتاريخ 2017-12-10.
- ^ Felix Richter (26 أغسطس 2016). "Chart: Digital Assistants – Always at Your Service". Statista. مؤرشف من الأصل في 2020-10-23. اطلع عليه بتاريخ 2017-12-10.
- ^ ا ب "Virtual Assistant Industry Statistics « Global Market Insights, Inc". Gminsights.wordpress.com. 30 يناير 2017. مؤرشف من الأصل في 2020-08-17. اطلع عليه بتاريخ 2017-12-10.
- ^ "Virtual digital assistants to overtake world population by 2021". ovum.informa.com (بالإنجليزية). Archived from the original on 2019-11-06. Retrieved 2018-05-11.
- ^ Jones، Nory B.؛ Graham، C. Matt (فبراير 2018). "Can the IoT Help Small Businesses?". Bulletin of Science, Technology & Society. ج. 38 ع. 1–2: 3–12. DOI:10.1177/0270467620902365. ISSN:0270-4676.
- ^ "Alexa and Siri Can Hear This Hidden Command. You Can't". The New York Times (بالإنجليزية الأمريكية). 10 May 2018. ISSN:0362-4331. Archived from the original on 2021-01-25. Retrieved 2018-05-11.
- ^ "As voice assistants go mainstream, researchers warn of vulnerabilities". CNET (بالإنجليزية). 10 May 2018. Archived from the original on 2020-11-09. Retrieved 2018-05-11.
- ^ Chung، H.؛ Iorga، M.؛ Voas، J.؛ Lee، S. (2017). "Alexa, Can I Trust You?". Computer. ج. 50 ع. 9: 100–104. DOI:10.1109/MC.2017.3571053. ISSN:0018-9162. PMID:29213147.
{{استشهاد بدورية محكمة}}
: الوسيط غير المعروف|PMCID=
تم تجاهله يقترح استخدام|pmc=
(مساعدة)