من المفيد معرفة ما هي نماذج لغة الذكاء الاصطناعي الأفضل أداءً وكيفية مقارنتها حيث أن Perceptrader AI تستخدم إكسبرت نماذج لغوية كبيرة للمساعدة في تحليل السوق.
هذا الموضوع يستحق نظرة فاحصة.
يمكن مقارنة نماذج LLM المختلفة لنماذج الذكاء الاصطناعي مع بعضها البعض وقياسها بعدة طرق. يمكن تقييم أداء LLM باستخدام مجموعة متنوعة من الأساليب، وذلك بفضل الموارد التي أعدها علماء الكمبيوتر المحترفون. يتم عرض ثلاث طرق مختلفة لقياس الأداء في جدول بسيط.
تعتمد النتائج على التقييمات البشرية في العمود الأول. يمكن للأشخاص مقارنة إجابات LLM المختلفة على موقع ويب منفصل. ثم يتم الحساب النتيجة من هذه المقارنات.
على غرار عمود النتيجة الأول، يستخدم عمود النتيجة الثاني LLM الأفضل أداءً، GPT-4. ولهذا السبب، فهو قادر على تقييم العديد من الإجابات دون الحاجة إلى تدخل بشري. ومن المثير للاهتمام أن النتائج مشابهة جدًا لنتائج التقييمات البشرية، كما هو موضح في هذه المقالة العلمية. إن GPT-4 متحيز عند قياس استجاباته، على الرغم من أنه يفضل إجاباته بشكل واضح.
في عمود النتيجة الثالث، ستجد مجموعة متنوعة من الأسئلة التي تغطي مجموعة متنوعة من المواضيع. يمكن العثور هنا على مجموعة واسعة من الأسئلة، بما في ذلك الرياضيات الابتدائية وتاريخ الولايات المتحدة وعلوم الكمبيوتر والقانون وما إلى ذلك. كان GPT-3 أول ماجستير في القانون يتم تقييمه به في عام 2020.
من هذا ماذا يمكن أن نتعلم؟
بعبارات بسيطة، يقدم GPT-4 الأداء الأفضل بين نماذج اللغات الكبيرة، بغض النظر عن كيفية قياسه. لذلك يستخدمه Perceptrader AI كنموذج أساسي له. كلود، ثاني أفضل نموذج، يأتي من منافس OpenAI Anthropic. يتفوق GPT-3.5 وجميع منافسيه، على الرغم من أن كلود يوفر نافذة سياقية أكبر، تصل إلى 100 ألف رمز (حوالي 75000 كلمة). هذا هو LLM الخاص بك إذا كنت تريد تلخيص كتاب.
بالمقارنة مع جميع منافسيها، فإن Bard، التي تعتمد على نموذج PaLM، تتخلف عنهم جميعًا. نظرًا لأنه يتمتع بإمكانية الوصول إلى الإنترنت، فقد يكون خيارًا أفضل في بعض السيناريوهات نظرًا لأنه لا يحتاج دائمًا إلى التحديث بالبيانات الحالية. من غير المرجح أن يتم تجاوز GPT-4 بواسطة Google LLM التالي.
ختاماً
يعد كلود وبارد من بين المتنافسين الآخرين الذين يتمتعون بميزات فريدة تناسب الاحتياجات المختلفة، خاصة فيما يتعلق بـ Perceptrader AI. علاوة على ذلك، يمكن تدريب النماذج مفتوحة المصدر، مثل عائلة اللاما، على بيانات محددة للتفوق على منافسيها. ولهذا السبب، من الضروري اختيار LLM الذي يأخذ في الاعتبار الأداء العام والمتطلبات الفريدة للمهمة المطروحة. ومن الآن فصاعدا، يمكننا أن نتوقع أن يتطور المشهد، مع استعداد شركات مثل جوجل لتحدي القادة الحاليين. يجب على أي متداول أو محترف آخر يسعى لتسخير قوة الذكاء الاصطناعي أن يظل على اطلاع دائم بهذه التطورات.
بصرف النظر عن حبها لبرنامج التداول الخوارزمي، Valeriia Mishchenko، فإن مطورة Perceptrader AI مفتونة بـ أحدث التطورات في تقنيات الذكاء الاصطناعي. وتدعي أن البحث في هذا المجال يستغرق معظم وقتها. سيكون من دواعي سرورها مشاركة المزيد من الأفكار مع عملائها في المستقبل إذا كانوا مهتمين.