Optimizing Abstractive Arabic Summarization via RLHF and DPO with Llama 2

Kahla Mram; Yang Zijian Győző: Optimizing Abstractive Arabic Summarization via RLHF and DPO with Llama 2.

[thumbnail of msznykonf_021_041-055.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_021_041-055.pdf

Letöltés (332kB) | Előnézet

Absztrakt (kivonat)

Given the advantages observed with Reinforcement Learning from Human Feedback (RLHF) and Direct Preference Optimization (DPO) in English, it is promising to explore their effectiveness for abstractive summarization in languages with complex morphological and syntactic features, such as Arabic. In this study, we fine-tune the Llama 2 model, which demonstrates a significant capability to enhance summarization results. We highlight how Llama 2, combined with advanced techniques like RLHF and DPO, markedly improves the quality of Abstractive Arabic summarization, showcasing the model’s superior performance in this challenging task. Furthermore, the AraSum corpus plays a critical role in achieving outstanding results, highlighting its effectiveness in improving the performance of summarization models. While this work focuses on Arabic, the techniques and insights presented are languageagnostic, offering broader applications for abstractive summarization in other languages. Additionally, we introduce the AraRLHF and AraDPO datasets, which will be made publicly available to support reproducibility and advance research in Arabic NLP.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Szemantika, pragmatika
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2025
Kötet: 21
ISBN: 978-963-688-034-7
Oldalak: pp. 41-55
Nyelv: angol
Kiadó: Szegedi Tudományegyetem TTIK, Informatikai Intézet
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (21.)
Konferencia típusa: Konferencia
Helyszin: Szeged
Dátum: 2025. február 6-7.
Befoglaló mű URL: https://acta.bibl.u-szeged.hu/88748/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 51-55. és a lábjegyzetekben ; ill. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2025. nov. 12. 12:21
Utolsó módosítás: 2025. nov. 12. 12:21
URI: http://acta.bibl.u-szeged.hu/id/eprint/88771
Bővebben:
Tétel nézet Tétel nézet