دور الذكاء الاصطناعي والتعلم الآلي في التعرف على الكلام

دور الذكاء الاصطناعي والتعلم الآلي في التعرف على الكلام

لفترة طويلة ، أراد الناس أن يكونوا قادرين على التحدث إلى الآلات. منذ أن بدأ العلماء والمهندسون في بناء أجهزة الكمبيوتر ، حاولوا دمج التعرف على الكلام في العملية. في عام 1962 ، قدمت شركة IBM Shoebox ، وهي آلة للتعرف على الكلام يمكنها القيام بحسابات رياضية بسيطة. يتعرف هذا الجهاز المبتكر على 16 كلمة منطوقة ويستجيب لها ، بما في ذلك عشرة أرقام من "0" إلى "9." عندما تم نطق عدد وكلمات أمر مثل "زائد" و "ناقص" و "إجمالي" ، أمر Shoebox آلة إضافة لحساب وطباعة الإجابات على مسائل حسابية بسيطة. تم تشغيل Shoebox عن طريق التحدث في ميكروفون ، والذي يحول الأصوات الصوتية إلى نبضات كهربائية. صنفت دائرة قياس هذه النبضات وفقًا لأنواع مختلفة من الأصوات ونشّطت آلة الإضافة المرفقة من خلال نظام الترحيل.

مع مرور الوقت ، تطورت هذه التكنولوجيا واليوم يتفاعل الكثير منا بشكل روتيني مع أجهزة الكمبيوتر الخارجية عن طريق الصوت. أشهر المساعدين الصوتيين اليوم هم Alexa by Amazon و Siri by Apple و Google Assistant و Cortana من Microsoft. يمكن لهؤلاء المساعدين أداء المهام أو الخدمات للفرد بناءً على الأوامر أو الأسئلة. إنهم قادرون على تفسير الكلام البشري والاستجابة عبر الأصوات المركبة. يمكن للمستخدمين طرح أسئلة على مساعديهم ، والتحكم في أجهزة التشغيل الآلي للمنزل وتشغيل الوسائط عبر الصوت ، وإدارة المهام الأساسية الأخرى مثل البريد الإلكتروني ، وقوائم المهام ، والتقويمات بالأوامر الشفهية ، وكلما استخدمنا هذه الأجهزة الصوتية كلما أصبحنا أكثر تعتمد على الذكاء الاصطناعي (AI) والتعلم الآلي.

الذكاء الاصطناعي (AI)

1

عندما تقول الذكاء الاصطناعي (AI) ، قد يعتقد الكثير من الناس أنك تتحدث عن الخيال العلمي ، على الرغم من أن الذكاء الاصطناعي جزء لا يتجزأ من حياتنا اليومية. في الواقع ، لقد كان ذلك منذ عقود. لكن الحقيقة هي أن الخيال العلمي كان حقًا هو أنه في بداية القرن العشرين th تعرّف الجمهور على الروبوتات الذكية الاصطناعية التي تشبه الإنسان. في الخمسينيات من القرن الماضي ، أصبحت مفاهيم الذكاء الاصطناعي أكثر فأكثر في بؤرة اهتمام العلماء والفلاسفة. في ذلك الوقت ، اقترح عالم الرياضيات البريطاني الشاب آلان تورينج أنه لا يوجد سبب يمنع الآلات (تمامًا مثل البشر) من حل المشكلات واتخاذ القرارات بناءً على المعلومات المتاحة. لكن في ذلك الوقت ، لم يكن لدى أجهزة الكمبيوتر إمكانية الحفظ وهو أمر أساسي للذكاء. كل ما فعلوه هو تنفيذ الأوامر. لكن مع ذلك ، كان آلان تورينج هو من وضع الهدف الأساسي والرؤية للذكاء الاصطناعي.

معروف على نطاق واسع بأنه والد الذكاء الاصطناعي هو جون مكارثي الذي صاغ مصطلح الذكاء الاصطناعي em>. بالنسبة له ، كان الذكاء الاصطناعي: "علم وهندسة صناعة الآلات الذكية". تم تقديم هذا التعريف في مؤتمر في كلية دارتموث عام 1956 وأشار إلى بداية أبحاث الذكاء الاصطناعي. منذ ذلك الحين ، ازدهر الذكاء الاصطناعي.

الذكاء الاصطناعي موجود في كل مكان في العالم الحديث. لقد أصبح أكثر شيوعًا بفضل زيادة حجم البيانات والخوارزميات المتقدمة والتحسينات في قوة الحوسبة والتخزين. في الغالب يرتبط تطبيق AI بالمهام الفكرية. نحن نستخدم الذكاء الاصطناعي للترجمة ، والعنصر ، والتعرف على الوجه والكلام ، واكتشاف الموضوع ، وتحليل الصور الطبية ، ومعالجة اللغة الطبيعية ، وتصفية الشبكات الاجتماعية ، ولعب الشطرنج ، إلخ.

التعلم الالي

التعلم الآلي هو تطبيق للذكاء الاصطناعي ويشير إلى الأنظمة التي لديها القدرة على التحسين من تجربتها الخاصة. أهم شيء هنا هو أن النظام يحتاج إلى معرفة كيفية التعرف على الأنماط. لكي تتمكن من القيام بذلك ، يحتاج النظام إلى التدريب: تقوم الخوارزمية بتغذية كميات كبيرة من البيانات بحيث تكون قادرة في مرحلة ما على تحديد الأنماط. الهدف هو السماح لأجهزة الكمبيوتر بالتعلم تلقائيًا دون تدخل بشري أو مساعدة.

عند الحديث عن التعلم الآلي ، من المهم ذكر التعلم العميق. لنبدأ بالقول إن إحدى الأدوات الرئيسية المستخدمة في التعلم العميق هي الشبكات العصبية الاصطناعية. هذه خوارزميات مستوحاة من بنية ووظيفة الدماغ ، على الرغم من أنها تميل إلى أن تكون ثابتة ورمزية ، وليست بلاستيكية وتناظرية مثل الدماغ البيولوجي. لذلك ، يعد التعلم العميق شكلاً متخصصًا من أشكال التعلم الآلي القائم على الشبكة العصبية الاصطناعية التي تهدف إلى تكرار الطريقة التي يتعلم بها البشر وهذا بمثابة أداة رائعة للعثور على أنماط كثيرة جدًا بالنسبة للمبرمج لتعليم الآلة. في العامين الماضيين ، كثر الحديث عن السيارات ذاتية القيادة وكيف يمكن أن تغير حياتنا. تقنية التعلم العميق هي المفتاح هنا ، لأنها تقلل الحوادث من خلال تمكين السيارة من تمييز المشاة عن صنبور إطفاء الحرائق أو التعرف على الضوء الأحمر. تلعب تقنية التعلم العميق أيضًا الدور الرئيسي في التحكم الصوتي في الأجهزة مثل الأجهزة اللوحية والهواتف والثلاجات وأجهزة التلفزيون وما إلى ذلك. غالبًا ما تستخدم شركات التجارة الإلكترونية الشبكات العصبية الاصطناعية كنظام تصفية يحاول التنبؤ بالعناصر التي يرغب المستخدم في عرضها وإظهارها. يشترى. تستخدم تقنية التعلم العميق أيضًا في المجال الطبي. يساعد الباحثين في مجال السرطان على الكشف التلقائي عن الخلايا السرطانية وبالتالي يمثل تقدمًا هائلاً في علاج السرطان.

التعرف على الكلام

تعمل تقنية التعرف على الكلام على تحديد الكلمات والعبارات من اللغة المنطوقة وتحويلها إلى تنسيق قابل للقراءة للجهاز. في حين أن بعض البرامج لا يمكنها تحديد سوى عدد محدود من العبارات ، يمكن لبعض برامج التعرف على الكلام الأكثر تعقيدًا فك تشفير الكلام الطبيعي.

هل هناك عقبات للتغلب عليها؟

على الرغم من أن تقنية التعرف على الكلام مريحة ، إلا أنها لا تسير دائمًا بسلاسة ولا يزال لديها بعض المشكلات للعمل من خلالها ، حيث يتم تطويرها باستمرار. يمكن أن تشمل المشاكل التي قد تنشأ من بين أمور أخرى ما يلي: قد تكون جودة التسجيل غير كافية ، وقد تكون هناك ضوضاء في الخلفية تجعل من الصعب فهم المتحدث ، كما قد يكون للمتحدث لهجة أو لهجة قوية حقًا (هل أنت هل تسمع لهجة جوردي؟) ، إلخ.

لقد تطور التعرف على الكلام كثيرًا ، لكنه لا يزال بعيدًا عن الكمال. لا يتعلق الأمر بالكلمات فقط ، فالآلة لا تزال غير قادرة على فعل الكثير من الأشياء التي يستطيع البشر القيام بها: لا يمكنهم قراءة لغة الجسد أو التعرف على النبرة الساخرة في صوت شخص ما. غالبًا لا ينطق الناس كل كلمة بالطريقة الصحيحة ويميلون إلى تقصير بعض الكلمات. على سبيل المثال ، عند التحدث بسرعة وبشكل غير رسمي ، غالبًا ما ينطق المتحدثون الأصليون باللغة الإنجليزية "go to" مثل "gonna". كل ما سبق يسبب عقبات للآلات التي يحاولون التغلب عليها ، ولكن لا يزال أمامهم طريق طويل. من المهم تسليط الضوء على أنه مع تغذية المزيد والمزيد من البيانات لتلك الخوارزميات المحددة ؛ يبدو أن التحديات تتناقص. يبدو أن مستقبل التعرف الآلي على الكلام مشرق.

أصبحت واجهات المستخدم التي تعمل بالطاقة الصوتية متوفرة وشائعة بشكل متزايد في المنازل. قد تصبح حتى المنصة التالية في مجال التكنولوجيا.

تقدم Gglot التعرف الآلي على الكلام في شكل خدمات النسخ الآلي - نقوم بتحويل الخطابات إلى نص. خدمتنا سهلة الاستخدام ، ولن تكلفك الكثير وستتم بسرعة!