2 Архитектонски детаљи и 2.1 Ретка мешавина стручњака
3.1 Вишејезични бенцхмаркс, 3.2 Перформансе на великом домету и 3.3 Бенцхмаркс
6 Закључак, захвалност и референце
• Цоммонсенсе Реасонинг (0-схот): Хелласваг [32], Виногранде [26], ПИКА [3], СИКА [27], ОпенбоокКА [22], АРЦ-Еаси, АРЦ-Цхалленге [8], ЦоммонсенсеКА [30]
• Ворлд Кновледге (5 снимака): НатуралКуестионс [20], ТривиаКА [19]
• Разумевање читања (0 снимака): БоолК [7], КуАЦ [5]
• Математика: ГСМ8К [9] (8 снимака) са мај@8 и МАТХ [17] (4 снимака) са мај@4
• Шифра: Хуманевал [4] (0-схот) и МБПП [1] (3-схот)
• Популарни збирни резултати: ММЛУ [16] (5 снимака), ББХ [29] (3 ударца) и АГИ Евал [34] (3-5 снимака, само питања на енглеском са више одговора)
Величина и ефикасност. Упоређујемо наше перформансе са породицом Ллама 2, са циљем да разумемо ефикасност Миктрал модела у спектру трошкова и перформанси (погледајте слику 3). Као ретки модел Миктуреоф-Екпертс, Миктрал користи само 13Б активних параметара за сваки токен. Са 5к нижим активним параметрима, Миктрал је у стању да надмаши Лламу 2 70Б у већини категорија.
Разлике у евалуацији. У неким мерилима, постоје неке разлике између нашег протокола за евалуацију и оног који је објављен у Ллама 2 раду: 1) на МБПП, користимо ручно верификован подскуп 2) на ТривиаКА, не пружамо контексте Википедије.
Аутори:
(1) Алберт К. Јианг; (2) Александар Саблајрол; (3) Антоан Роук; (4) Артур Менш; (5) Бланш Савари; (6) Крис Бамфорд; (7) Девендра Синг Чаплот; (8) Дијего де лас Касас; (9) Ема Боу Хана; (10) Флоријан Бресанд; (11) Гианна Ленгиел; (12) Гијом Бур; (13) Гуиллауме Лампле; (14) Лелио Ренард Лавауд; (15) Луциле Саулниер; (16) Марие-Анне Лацхаук; (17) Пиерре Стоцк; (18) Сандееп Субраманиан; (19) Софија Јанг; (20) Шимон Антониак; (21) Тевен Ле Сцао; (22) Теофил Жервет; (23) Тибо Лаврил; (24) Томас Ванг; (25) Тимоте Лакроа; (26) Вилијам Ел Сајед.