Arabic Wordlist

Over 200,000 entries

Covers proper nouns and technical terms

Ideal for speech technology

Overview

CJKI maintains comprehensive monolingual wordlists for Chinese, Japanese, Korean (CJK), Arabic, and Spanish covering near 15 million entries in total.

Our Arabic Wordlist (AWL) covers over 200,000 canonical forms for general vocabulary and proper nouns and includes romanized readings, part-of-speech codes, and semantic classification type codes.

Used by some of the world’s leading IT companies, this database is suitable for a variety of NLP applications for information retrieval like search engines, morphological analysis tools like tokenizers, and speech technology applications like text-to-speech synthesis. The related ArabLEX (Arabic Full-Form Lexicon) under construction is expected to exceed 530 million entries.

Arabic Wordlist

TypePOSUnvocalizedVocalizedTranscription
PNPمشاضيمَشَاضِيmashā́ḍi̱
PNPمشاديمَشَادِيmashā́di̱
PNPمشاقمِشَاقmishā́q
GAمشاركمُشَارِكmushā́rik
PNPمشايطةمَشَايْطَةmashā́yṭa
GNCمشعلمِشْعَلmíshɛal
GAمشهرمُشَهَّرmusháhhar
PNPمشهورمَشْهُورmashhū́r
PNPمشناءمِشْنَاءmishnā́ʾ
GAمشرحمُشَرَّحmushárraḥ
GNCمشتركمُشْتَرِكmúshtarik
GAمؤاتمُؤَاتٍmuʾā́tin
GAمؤسلمُؤَسَّلmuʾással
PNPمذبانمُذْبَانmudhbā́n
GNCمذبحمَذْبَحmádhbaḥ
PNPمذيمِذِيmídhi̱
GNCمذيعمُذِيعmudhī́ɛ
PNPماصيمَاصِّيّma̱ṣṣíy̱
PNPماله اللهمَالِه اَللّٰهmā́lih ʾallā́h
PNPمالونمَالُونmālū́n
PNPماركومَارْكُوmā́rku̱
PNPمايهةمَايِهَةmā́yiha
PNPمضمونمَضْمُونmaḍmū́n
GNCمضيفةمَضْيَفَةmáḍyafa
PNPمعاجينيمَعَاجِينِيmaɛa̱jī́ni̱
PNPمعاقبةمَعَاقِبَةmaɛā́qiba
GVNمعاقرةمُعَاقَرَةmuɛā́qara
PNPمعارفةمَعَارِفَةmaɛā́rifa
PNPمعلوممَعْلُومmaɛlū́m
GAمعنىمُعَنَّىmuɛánna̱
PNPمعقبمُعَقِّبmuɛáqqib
GAمعترفمُعْتَرَفٌmuɛtárafun
PNPمعيطمَعِيطmaɛī́ṭ
PNPمعززمُعَزَّزmuɛázzaz
GVNمحاباةمُحَابَاةmuḥābā́
PNPمحاميمُحَامِيmuḥā́mi̱
GAمحايدمُحَايِدmuḥā́yid
GAمحصىمُحْصًىmúḥṣan
GAمحدودمَحْدُودmaḥdū́d
GNCمحكمةمَحْكَمَةmáḥkama
PNPمحمدوحمُحَمْدُوحmuḥamdū́ḥ
PNPمحمسةمَحْمَسَةmáḥmasa
GAمحمودمَحْمُودmaḥmū́d
PNPمحنفمُحَنَّفmuḥánnaf
GNCمحتفلمُحْتَفَلmúḥtafal
PNPمحيفظمُحَيْفِظmuḥáyfiẓ
PNPمحيلانمَحِيلَانmaḥīlā́n
GVNمصادفةمُصَادَفَةmuṣā́dafa
GAمصدرمُصَدَّرmuṣáddar
GNCمصفقمَصْفَقmáṣfaq
PNPمصركيمُصَرْكِيmuṣárki̱
PNPمصوصمَصُوصmaṣū́ṣ
GNCمطحنةمِطْحَنَةmíṭḥana
GAمطلعمُطَّلِعٌmuṭṭáliɛun
PNPمطراشمِطْرَاشmiṭrā́sh
PNPمطواحمِطْوَاحmiṭwā́ḥ
GAمظلمُظِلّmuẓíḻ
GNCمباراةمُبَارَاةmubārā́
GAمبعوجمَبْعُوجmabɛū́j
GAمبرقشمُبَرْقَشmubárqash
GAمبتهجمُبْتَهِجmúbtahij
PNPمبخوتيمَبْخُوتِيّmabkhu̱tíy̱
GAمبينمُبَيِّنmubáyyin
PNPمدكورمَدْكُورmadkū́r
GAمدمنمُدْمِنmúdmin
PNPمدرارمِدْرَارmidrā́r
PNPمدوحمُدُوحmudū́ḥ
GAمدخرمُدَّخِرmúddakhir
PNPمفاتنمَفَاتِنmafā́tin
GNCمفحممُفحَّمmúfḥḥam
PNPمفندمُفَنِّدmufánnid
PNPمفرسمُفْرِسmúfris
PNPمغشةمُغْشَةmúghsha
GAمغالمُغَالٍmughā́lin
PNPمغامسيمُغَامِسِيmughā́misi̱
PNPمغلسمُغَلِّسmughállis
GAمغلوبمَغْلُوبmaghlū́b
GAمغرضمُغْرِضmúghriḍ
GVNمهارةمَهَارَةmahā́ra
GAمهملمُهْمِلmúhmil
GVمهرمَهَرَmáhara
GAمجذممُجَذَّمmujádhdham
PNPمجذوبةمَجْذُوبَةmajdhū́ba
GNCمجعدمِجْعَدmíjɛad
PNPمجعيطمَجْعِيطmajɛī́ṭ
GNCمجنبمِجْنَبmíjnab
PNPمجرنمُجْرَنmújran
GAمكافئمُكَافِئmukā́fiʾ
PNPمكاويمَكَّاوِيّmakka̱wíy̱
PNPمكلايمِكْلَايmiklā́y
GAمكنىمُكَنًّىmukánnan
PNPمكركرمُكَرْكِرmukárkir
GAمكسبمُكْسِبmúksib
GAمكتوفمَكْتُوفmaktū́f
PNPملاءمِلَاءmilā́ʾ
GVNملابسةمُلَابَسَةmulā́basa
GVNملامةمَلَامَةmalā́ma
PNPملحانمِلْحَانmilḥā́n
GNCملجأمَلْجَأmáljaʾ
GAملسوعمَلْسُوعmalsū́ɛ
PNPملتممُلْتِمmúltim
PNPملوقمَلُوقmalū́q
GNCمليارديرمِلْيَارْدِيرmilyārdī́r
GNCممشطمُمَشَّطmumáshshaṭ
GAممتصمُمْتَصّmumtáṣ̱
GAمموهمُمَوَّهmumáwwah
PNPمنشدمُنْشِدmúnshid
PNPمنشورمَنْشُورmanshū́r
PNPمنامُنَاmúna̱
GVNمناضلةمُنَاضَلَةmunā́ḍala
GVمنحمَنَحَmánaḥa
GAمنصرممُنْصَرِمmúnṣarim
GNCمنبعمَنْبَعmánbaɛ
GAمنفسخمُنْفَسِخmúnfasikh
GNCمنهلمَنْهَلmánhal
PNPمنجةمِنْجَةmínja
PNPمنقريمُنْقِرِيmúnqiri̱
GAمنقوصمَنْقُوصmanqū́ṣ
PNPمنقولةمَنْقُولَةmanqū́la
GNCمنسلخمُنْسَلَخmúnsalakh
GAمنتقدمُنْتَقَدmúntaqad
PNPمنوفمُنْوِفmúnwif
PNPمنيرفامِنِيرْفَاminī́rfa̱
PNPمنزوعمَنْزُوعmanzū́ɛ
GVNمقاصةمُقَاصَّةmuqā́ṣṣa
PNPمقصورةمَقْصُورَةmaqṣū́ra
GNCمقطفمِقْطَفmíqṭaf
PNPمقبولةمَقْبُولَةmaqbū́la
GAمقدورمَقْدُورmaqdū́r
PNPمقميمُقْمِيmúqmi̱
GAمقنطرمُقَنْطَرmuqánṭar
PNPمقرشمَقْرَشmáqrash
PNPمقراصيمِقْرَاصِيmiqrā́ṣi̱
GAمقسممُقَسَّمmuqássam
GAمقترضمُقْتَرَضmúqtaraḍ
PNPمقوىمُقَوَّىmuqáwwa̱
PNPمراحيلمُرَاحِيلmurāḥī́l
GAمراقصةمُراقِصَةmúrqiṣa
PNPمرضعةمُرْضِعَةmúrḍiɛa
PNPمربىمُرَبَىmúraba̱
PNPمردادمِرْدَادmirdā́d
GAمرغوبمَرْغُوبٌmarghū́bun
PNPمرميةمَرْمِيَّةmarmíyya
GNCمرسممَرْسَمmársam
PNPمرسسمُرْسِسmúrsis
PNPمرتويمُرْتَوِيmúrtawi̱
PNPمروعمُرَوَّعmuráwwaɛ
PNPمريوشمَرْيُوشmaryū́sh
PNPمريزنمَرِيزِنmarī́zin
GNCمساقمَسَاقmasā́q
GNCمسعىمَسْعًىmásɛan
GAمسبوتمَسْبُوتmasbū́t
PNPمسفاطمِسْفَاطmisfā́ṭ
GVمسلممَسْلَمَmáslama
PNPمسرقيمُسْرَقِيّmusraqíy̱
GAمستحدثمُسْتَحْدِثmustáḥdith
PNPمستديمُسْتَدِّيّmustaddíy̱
GAمستفحلمُسْتَفْحِلmustáfḥil
GNCمستنداتمُسْتَنَدَاتmustanadā́t
GAمستولىمُسْتَوْلًىmustáwlan
GAمسخنمُسَخِّنmusákhkhin
GAمتشنجمُتَشَنِّجmutashánnij
GVNمتانةمَتَانَةmatā́na
PNPمتعيقمُتَعَيِّقmutaɛáyyiq
GAمتحدبمُتَحَدِّبmutaḥáddib
GNCمتطلباتمُتَطَلَّبَاتmutaṭallabā́t
GAمتفتحمُتَفَتِّحmutafáttiḥ
GAمتهورمُتَهَوِّرmutaháwwir
GAمتكيسمُتَكَيِّسmutakáyyis
GAمتمركزمُتَمَرْكِزmutamárkiz
GAمتناقصمُتَنَاقِصmutanā́qiṣ
PNPمتنبكمُتَنَبِّكmutanábbik
GAمتقشفمُتَقَشِّفmutaqáshshif
GAمترتبمُتَرَتِّبmutaráttib
GAمتسامتمُتَسَامِتmutasā́mit
GAمتثاقلمُتَثَاقِلmutathā́qil
GAمتوطنمُتَوَطِّنmutawáṭṭin
GAمتخوممَتْخُومmatkhū́m
PNPمثالمَثَّالmaththā́l
GAمثبتمُثَبِّتmuthábbit
GNCمثمنمُثَمِّنmuthámmin
GAمواربمُوَارِبmuwā́rib
PNPموازينيمَوَازِينِيmawa̱zī́ni̱
GAموصمُوصٍmū́ṣin
PNPموديمَوَدِّيّmawaddíy̱
GAموهوبمَوْهُوبmawhū́b
PNPمولدمُوَلَّدmuwállad
PNPمومنيمُومِنِيmū́mini̱
GNCموقعةمَوْقِعَةmáwqiɛa
GAمورطمُوَرَّطmuwárraṭ
PNPموسرمُوسْرِmū́sri
GNDموتوسيكلمُوتُوسيكلmūtū́sykl
PNPمويعزمُوَيْعِزmuwáyɛiz
PNPمويهيمُوَيْهِيّmuwayhíy̱
GAمخضوبمَخْضُوبmakhḍū́b
GAمخمرمُخَمَّرmukhámmar
GVمخرمَخَرَmákhara
GAمخترعمُخْتَرِعmúkhtariɛ
PNPمخيفمَخِيفmakhī́f
PNPميعاريمَيْعَارِيّmayɛa̱ríy̱
PNPميدانيمَيْدَانِيّmayda̱níy̱
PNPميلادمِيلَادmīlā́d
PNPميليجيمِيلِيجِيّmi̱li̱jíy̱
PNPميراغيمِيرَاغِيmi̱rā́ghi̱
PNPميرعالمِيَّرْعَالmīyarɛā́l
PNPميرزامِيرْزَاmī́rza̱
GNCميسمِيسmīs
PNPميثاءمَيْثَاءmaythā́ʾ
PNPمزافتمُزَافِتmuzā́fit
GNCمزارمَزَارmazā́r
PNPمزودمِزْوَدmízwad
PNPمزوديمِزْوَدِيmízwadi̱

Practical Applications

CJKI’s Comprehensive Wordlists are being used by some of the world’s leading IT companies for a variety of natural language processing applications, including:

Information retrieval

Word segmentation

Morphological analysis

Related Resources

CWL

Chinese Wordlist

General vocabulary, proper nouns, and technical terms

JWL

Japanese Wordlist

General vocabulary, proper nouns, and technical terms

KWL

Korean Wordlist

General vocabulary, proper nouns and technical terms