محطة رقم، وهي شركة ناشئة تستخدم نماذج اللغة الموسعة (LLM) لتشغيل منصة تحليل البيانات الخاصة بها، أطلقت اليوم أول منتج قائم على السحابة: Numbers Station Cloud الذي يحمل اسمًا مناسبًا، والذي أصبح الآن في مرحلة الوصول المبكر. باستخدام هذه الخدمة، يمكن لأي مستخدم في الشركة تقريبًا تحليل بياناته الداخلية باستخدام واجهة الدردشة الخاصة بـ Numbers Station.
تركز العديد من الأدوات المشابهة على ترجمة استعلامات اللغة الطبيعية إلى لغة قاعدة بيانات مثل SQL. ومع ذلك، يقول فريق Numbers Station إن هذا النهج له حدود، ويرجع ذلك جزئيًا إلى أن LLM العام لا يفهم كيفية عمل شركة معينة، وكيف تقوم ببناء بياناتها، وكيف يشير الأشخاص داخل الشركة إلى كائنات بيانات محددة.
كمؤسس مشارك والرئيس التنفيذي لشركة Numbers Station كريس ابيرجر أخبرني أنه سئم قليلاً من الحديث عن الطريقة التي تتيح بها الخدمة للمستخدمين “الدردشة مع بياناتهم”، لأن هناك الكثير من الضجيج حولها. وقال لي: “لكن المستوى التالي من قادة الأعمال، والمستخدمين غير التقنيين، الذين لديهم أسئلة ليطرحوها ومن ثم يحصلون على إجابات من مصادر البيانات المنظمة الكلاسيكية هذه، هو في الحقيقة ما وصلت إليه الأمور”. “هناك الكثير من نماذج البيانات، وتدفق البيانات حول هذه النماذج الأساسية ونماذج اللغة الكبيرة لجعلها تعمل.”
بالنسبة إلى Numbers Station، كان ذلك يعني تخصيص الكثير من الموارد الهندسية لإنشاء ما تسميه الشركة الكتالوج الدلالي الخاص بها. يعد هذا الكتالوج في الأساس مصدرًا منظمًا تلقائيًا لمقاييس الشركة وتعريفاتها. هذا الكتالوج خاص بكل شركة (وليس مشتركًا بينها). وصف أبيرجر الكتالوج بأنه “شيء وحشي” يضمن، على سبيل المثال، أن تعريف النموذج “للإيرادات المتكررة” يتماشى مع استخدام الشركة لهذا المصطلح.
على الرغم من أن منصة Numbers Station تعتمد على مجموعة من دورات LLM المتخصصة جدًا ونماذج التعلم الآلي، إلا أن هذا الكتالوج هو الذي يجمع كل ذلك معًا. كمؤسس مشارك وكبير العلماء في Numbers Station إيناس الشامي أخبرني أن الفريق قد قلل في البداية من تقدير التحدي المتمثل في بناء هذا الجزء من المنصة.
قالت لي: “يعود الأمر إلى الهندسة الكلاسيكية (التعلم الآلي) والبيانات: كيفية إنشاء تمثيل معرفي يمكن للنموذج استخدامه فعليًا للإجابة على هذه الأسئلة”. “لأنه لا توجد طريقة يمكن لنموذج واحد أن يشمل كل هذه المقاييس، كل هذه الأشياء التي يطلبها مستخدمو الأعمال.” بعد كل شيء، حتى البشر لا يفهمون جميع الأسئلة على الفور، ويجب على النموذج تحويل هذه الأسئلة الغامضة إلى استفسارات محددة للغاية. أرقام المحطة بحث يُظهر أن أسلوبه يؤدي إلى تحسين الدقة بشكل ملحوظ مقارنة بخطوط أنابيب تحويل النص إلى SQL التقليدية.
وعلى الرغم من أن الشركة تطلق خدمة الدردشة هذه اليوم، إلا أن الرؤية الشاملة أوسع بكثير.
وقال أبيرجر: “ما نقوم به، بشكل أساسي، هو بناء منصة ذكاء اصطناعي للتحليلات”. “إنه أحد التطبيقات (…).” هناك مشروع أكبر وأوسع ما زلنا نعمل عليه كشركة يعالج مجموعة من مشكلات البيانات المختلفة التي تضاف هنا، ومن أمثلة ذلك: كيف يمكنني إثراء بياناتي ببيانات الطرف الثالث؟ مصادر؟ كيف يمكنني استخدام بعض هذه الخوارزميات الكلاسيكية مثل المطابقة الغامضة وما إلى ذلك؟ ؟ هناك عدد لا حصر له تقريبًا من المتحدثين الذين يمكنك البناء عليهم في هذه المنصة.
وقد وقعت الشركة بالفعل عقودًا مع العديد من عملاء Fortune 500، بما في ذلك شركة الخدمات العقارية العالمية Jones Lang LaSalle. وقال شاراد راستوجي، الرئيس التنفيذي لتكنولوجيا ديناميكيات العمل في شركة جونز لانج لاسال: “تعد Numbers Station في طليعة الذكاء الاصطناعي للمؤسسات فيما يتعلق بالبيانات المنظمة”. “نحن معجبون بمنصة Numbers Station الجذابة والموثوقة. فهو يتعلم باستمرار عندما نستخدمه، مما يمكّن فرق البيانات لدينا من اكتشاف الفرضيات والتحقق منها لتحقيق نتائج أعمال مؤثرة.
Source link