الأخبار التكنولوجية والاستعراضات والنصائح!

فيل هول ، كبير مسؤولي النمو في LXT – سلسلة مقابلات

ستساعدك المقالة التالية: فيل هول ، كبير مسؤولي النمو في LXT – سلسلة مقابلات

كبير مسؤولي النمو في LXT فيل هول هو مدير تنفيذي سابق في شركة Appen و مجلس تكنولوجيا فوربس عضو. في دوره القيادي في Appen ، أدار قسمًا يضم أكثر من 1000 موظف ولعب دورًا رئيسيًا في تحقيق 17 عامًا متتاليًا من نمو الإيرادات مع ربحية قوية باستمرار. في منصبه الحالي مع LXT ، يعمل مع فريق مختار بعناية من الخبراء لتحقيق أهداف نمو طموحة.

LXT هي شركة رائدة في مجال بيانات التدريب على الذكاء الاصطناعي لتشغيل التكنولوجيا الذكية للمؤسسات العالمية ، بما في ذلك أكبر شركات التكنولوجيا في العالم. بالشراكة مع شبكة دولية من المساهمين ، تجمع LXT البيانات وتعلق عليها عبر طرائق متعددة بالسرعة والحجم والرشاقة التي تتطلبها المؤسسة. لديهم خبرة عالمية تمتد إلى أكثر من 115 دولة و 750 لغة. تأسست في عام 2010 ، ويقع المقر الرئيسي لشركة LXT في تورنتو ، كندا مع وجود في الولايات المتحدة وأستراليا ومصر والمملكة المتحدة وتركيا. تخدم الشركة العملاء في أمريكا الشمالية وأوروبا وآسيا والمحيط الهادئ والشرق الأوسط.

متى اكتشفت في البداية أنك شغوف باللغة؟

لطالما استحوذت على فضول اللغة لطالما أتذكرها ، ولكن فيما يتعلق بتفاعلي المباشر مع اللغة واللغويات ، كانت هناك نقطة تحول مهمة واحدة بالنسبة لي. لقد أدركنا في وقت مبكر جدًا أن أحد أطفالنا يعاني من عسر القراءة ، وعندما تحدثنا إلى مدرستها حول الدعم الإضافي ، قالوا إنه بينما كانت هناك برامج يمكنهم الوصول إليها ، كان هناك أيضًا أشياء يمكنني القيام بها كمتطوع في المدرسة لمساعدتنا ابنة وغيرهم من الأطفال. سارت الأمور بشكل جيد ، ومن هناك ذهبت لدراسة اللغويات ووجدت نفسي أدرس في اثنتين من الجامعات هنا في سيدني.

كنت تدرس اللغويات قبل أن تنتقل إلى مساحة بيانات الكلام ، ما الذي ألهمك لتحويل تركيزك؟

كانت شركة Appen التي تتخذ من سيدني مقراً لها تنتقل للتو من كونها عملية نفدت من غرفة احتياطية في منزل إلى كونها عملية تجارية كاملة. قيل لي إنهم يبحثون عن لغويين (ربما بشكل أكثر دقة ، لغوي!) وقد تعرفت على المؤسسين جولي وكريس فونويلر. كان الانتقال تدريجيًا واستغرق نحو عامين. كنت مترددًا في الابتعاد عن التدريس – كان العمل مع الطلاب المتفوقين ملهمًا وممتعًا. لكن خلال تلك السنوات الرائدة على وجه الخصوص ، كنت أقوم بحل المشكلات الصعبة جنبًا إلى جنب مع خبراء تكنولوجيا اللغات الرائدين في العالم ، وكانت مستويات الإثارة عالية. كان الكثير مما يعتبر أمرًا مفروغًا منه اليوم ، يمثل تحديًا كبيرًا في ذلك الوقت.

لقد خرجت من التقاعد للانضمام إلى LXT. ما الذي دفعك لفعل هذا؟

هذا سؤال مثير للاهتمام لأنني بالتأكيد كنت أستمتع بنفسي في التقاعد. في الواقع ، اتصل بي المؤسس المشارك والرئيس التنفيذي محمد عمر قبل أشهر من الرد على استفساره الأولي ، حيث كنت أعيش حياة مريحة ولم أفكر حقًا في العودة إلى العمل بدوام كامل. بعد الموافقة على إجراء المكالمة الأولى حيث سأل Mo عن إمكانية الانضمام إلى LXT ، توقعت فقط الاستماع بأدب وأرفض.

لكن في النهاية ، كانت الفرصة ببساطة أفضل من أن تقاوم.

أثناء حديثي مع محمد والأعضاء الآخرين في فريق LXT ، أدركت على الفور شغفًا مشتركًا باللغة. كان الفريق الذي شكله محمد مليئًا بالمفكرين المبدعين بطاقة لا حدود لها والذين كانوا ملتزمين تمامًا بمهمة الشركة.

عندما تعلمت المزيد عن الفرصة مع LXT ، أدركت أنها فرصة لا أريد تفويتها. كانت هنا شركة ذات إمكانات هائلة للتوسع والنمو في مجال أنا متحمس له. ومع استمرار نمو سوق الذكاء الاصطناعي بشكل كبير ، فإن فرصة مساعدة المزيد من المؤسسات على الانتقال من التجربة إلى الإنتاج هي فرصة مثيرة يسعدني جدًا أن أكون جزءًا منها.

ما هي بعض التحديات الحالية وراء الحصول على البيانات على نطاق واسع؟

التحديات متنوعة مثل التطبيقات التي تقودها.

من منظور عملي ، تشمل التحديات المصداقية والموثوقية والدقة والأمان والتأكد من أن البيانات مناسبة للغرض – وهذا دون مراعاة العدد المتزايد من التحديات القانونية والأخلاقية المتأصلة في الحصول على البيانات.

على سبيل المثال ، يتطلب تطوير التكنولوجيا لدعم المركبات ذاتية القيادة تجميع كميات كبيرة للغاية من البيانات عبر العديد من السيناريوهات حتى تفهم السيارة كيفية الاستجابة لمواقف العالم الحقيقي. هناك عدد لا حصر له من حالات الحافة التي يمكن أن يواجهها المرء أثناء القيادة ، لذا فإن الخوارزميات التي تشغل هذه المركبات تحتاج إلى مجموعات بيانات تغطي كل شيء من الشوارع إلى إشارات التوقف إلى الأجسام المتساقطة. ثم إذا قمت بضرب ذلك في عدد الأحداث الجوية التي يمكن أن تحدث ، فإن كمية بيانات التدريب المطلوبة تزداد أضعافا مضاعفة. تحتاج شركات السيارات التي تغامر في الفضاء المستقل إلى إنشاء خط بيانات موثوق به ، والقيام بذلك بمفردهم سيستغرق قدرًا هائلاً من الموارد.

حالة استخدام أخرى هي توسيع منتج الذكاء الاصطناعي الصوتي الحالي في أسواق جديدة للاستحواذ على حصة السوق والعملاء الجدد. يتطلب هذا حتماً بيانات اللغة ، ولتحقيق الدقة ، من الأهمية بمكان الحصول على بيانات الكلام من المتحدثين الأصليين عبر مجموعة متنوعة من الملفات الشخصية الديموغرافية. بمجرد جمع البيانات ، يجب نسخ ملفات الكلام لتدريب خوارزميات البرمجة اللغوية العصبية للمنتج. يعد القيام بذلك بلغات متعددة وعلى أحجام البيانات المطلوبة لتكون فعالة أمرًا صعبًا للغاية بالنسبة للشركات للقيام بها بمفردها ، خاصة إذا كانت تفتقر إلى الخبرة الداخلية في هذا المجال.

هذان مثالان فقط على العديد من التحديات الموجودة مع جمع البيانات للذكاء الاصطناعي على نطاق واسع ، ولكن كما يمكنك أن تتخيل ، فإن كل من التشغيل الآلي للمنزل ، والجهاز المحمول ، ومجموعات البيانات الحيوية لكل منها تحدياتها الخاصة.

ما هي الطرق الحالية التي تستخدم بها LXT البيانات وتعلق عليها؟

في LXT ، نقوم بجمع البيانات والتعليق عليها بشكل مختلف لكل عميل ، حيث أن جميع ارتباطاتنا مصممة لتلبية مواصفات عملائنا. نحن نعمل عبر مجموعة متنوعة من أنواع البيانات ، بما في ذلك الصوت والصورة والكلام والنصوص والفيديو. لجمع البيانات ، نحن نعمل مع شبكة عالمية من المقاولين لجمع البيانات في هذه الأساليب المختلفة. يمكن أن تتراوح المجموعات من الحصول على البيانات في إعدادات العالم الحقيقي مثل المنازل أو المكاتب أو داخل السيارة ، إلى داخل الاستوديو مع مهندسين ذوي خبرة في حالة بعض مشاريع جمع بيانات الكلام.

تشمل قدراتنا على شرح البيانات أيضًا طرائق متعددة. بدأت تجربتنا في مجال الكلام وعلى مدار الـ 12 عامًا الماضية ، توسعنا إلى أكثر من 115 دولة وأكثر من 750 لغة. وهذا يعني أنه يمكن للشركات من جميع الأحجام الاعتماد على LXT لمساعدتها على اختراق مجموعة واسعة من الأسواق وجذب شرائح عملاء جديدة. لقد توسعنا مؤخرًا في بيانات النصوص والصور والفيديو ، ويتم استخدام نظامنا الأساسي الداخلي لتقديم بيانات عالية الجودة لعملائنا.

من مجالات النمو المثيرة الأخرى بالنسبة لنا عمل التعليقات التوضيحية الآمن. في هذا العام فقط ، قمنا بتوسيع بصمة منشآتنا الآمنة ISO 27001 من موقعين إلى خمسة مواقع في جميع أنحاء العالم. لقد طورنا الآن كتيب قواعد اللعبة الذي يمكننا من إنشاء مرافق جديدة في غضون أشهر. الخدمات التي نركز عليها في هذه المرافق الآمنة هي حاليًا التعليقات التوضيحية لبيانات الكلام ونسخها ، ولكن يمكن استخدامها للتعليق التوضيحي عبر العديد من أنواع البيانات.

لماذا يعد الحصول على البيانات بهذه الطريقة بديلاً ممتازًا للبيانات التركيبية؟

تُعد البيانات التركيبية تطورًا مثيرًا في مجال الذكاء الاصطناعي وهي مناسبة تمامًا لحالات استخدام محددة ، لا سيما حالات الحافة التي يصعب التقاطها في العالم الحقيقي. يتزايد استخدام البيانات التركيبية ، لا سيما في المراحل الأولى من نضج الذكاء الاصطناعي حيث لا تزال الشركات في وضع التجريب. ومع ذلك ، لدينا بحث يوضح أنه مع نضج المؤسسات لاستراتيجيات الذكاء الاصطناعي الخاصة بها ودفع المزيد من النماذج إلى الإنتاج ، فمن المرجح أن تستخدم أساليب التعلم الآلي الخاضعة للإشراف أو شبه الخاضعة للإشراف والتي تعتمد على البيانات المشروحة من قبل الإنسان.

البشر ببساطة أفضل من أجهزة الكمبيوتر في فهم الفروق الدقيقة لإنشاء البيانات اللازمة لتدريب نماذج ML على الأداء بدقة عالية ، كما أن الإشراف البشري أمر بالغ الأهمية لتقليل التحيز.

لماذا هذه البيانات مهمة جدًا لمعالجة الكلام واللغة الطبيعية؟

لكي تعمل خوارزميات معالجة الكلام واللغة الطبيعية بشكل فعال في الأسواق المقصودة ، يجب تدريبهم على كميات كبيرة من البيانات التي يتم الحصول عليها من متحدثين أصليين لديهم السياق الثقافي للمستخدمين النهائيين الذين يمثلونهم. بدون هذه البيانات ، سيكون لاعتماد الذكاء الاصطناعي الصوتي قيودًا شديدة.

بالإضافة إلى ذلك ، يجب مراعاة البيئة عند جمع بيانات الكلام. إذا تم استخدام حل الذكاء الاصطناعي الصوتي الذي يتم تدريبه في السيارة ، على سبيل المثال ، فهناك طرق مختلفة وظروف مناخية تؤثر على الكلام وتحتاج إلى أخذها في الاعتبار. هذه سيناريوهات معقدة حيث يمكن لشريك البيانات ذي الخبرة المساعدة.

هل هناك أي شيء آخر تود مشاركته حول LXT؟

أولاً ، أود أن أشكرك على إتاحة الفرصة لي لمشاركة قصتنا! أود أن أوضح أن شركتنا ملتزمة بمساعدة المؤسسات من جميع الأحجام على النجاح في مبادرات الذكاء الاصطناعي الخاصة بهم. لقد ركزنا على تقديم بيانات الذكاء الاصطناعي عالية التخصيص إلى الشركات في جميع أنحاء العالم لأكثر من 12 عامًا ، ويسعدنا التواصل مع أي شخص يتطلع إلى إنشاء خط بيانات موثوق به لدعم مشاريع الذكاء الاصطناعي الخاصة بهم.