ArabLEX
アラビア語全活用形辞書データベース
5.3億項目以上を収録
すべての活用形を収録
NLP、AIとサイバーセキュリティ対策に最適
概要
アラビア語全活用形データベース(ArabLEX: Arabic Full-Form Lexicon)は、アラビ語計算辞書学の手法を用いて構築した最も包括的なアラビア語全活用形データベースで、約5.3億項目を網羅します。
全活用形とは、活用形をすべて網羅したことを意味します。本データベースは、一般語彙の活用形に限らず、固有名詞(人名と地名)の活用形を初めて収録対象としています。
ArabLEXはアラビア語自然言語処理とAI向けに開発された究極の言語資源として、機械翻訳、音声技術、深層学習、サイバーセキュリティ等のアプリ開発に最適で、その規模と包括性において匹敵するものをみません。
特徴
- 極めて包括的なデータベースで、5.3億項目の全活用形を収録
- 屈折形、格変化形、活用形をすべて網羅
- 固有名詞を含む全活用形異表記を数億項目収録
- すべての見出し語に母音付きと母音無しアラビア語を併記
- 正確なIPA音声・音韻表記
- 形態、構文、音韻関連の情報を幅広く提供
- すべての変化形は見出し語と対応付け
- 継続的な校正と拡張を実施中
* タブで画面を切り替えることができます。
データサンプル(名詞)
データサンプル(動詞)
ARABIC | ROMAN | LEMMA | GEN | NUM | CASE |
---|---|---|---|---|---|
كَاتِبٌ | kā́tibun | كَاتِبٌ | M | S | NOM |
كَاتِبُ | kā́tibu | كَاتِبٌ | M | S | NOM |
كَاتِبِي | kā́tibi̱ | كَاتِبٌ | M | S | NOM |
كَاتِبُكَ | kātíbuka | كَاتِبٌ | M | S | NOM |
كَاتِبُكِ | kātíbuki | كَاتِبٌ | M | S | NOM |
كَاتِبُهُ | kātíbuhu | كَاتِبٌ | M | S | NOM |
كَاتِبُهَا | kātíbuha̱ | كَاتِبٌ | M | S | NOM |
كَاتِبُنَا | kātíbuna̱ | كَاتِبٌ | M | S | NOM |
كَاتِبُكُمْ | kātíbukum | كَاتِبٌ | M | S | NOM |
كَاتِبُكُنَّ | kātibukúnna | كَاتِبٌ | M | S | NOM |
ARABIC | ROMAN | LEMMA | PER | FORM | TENSE |
---|---|---|---|---|---|
كَتَبَ | kátaba | كَتَبَ | 3SM | 01 | 01 |
كَتَبَنِي | katábani̱ | كَتَبَ | 3SM | 01 | 01 |
كَتَبَكَ | katábaka | كَتَبَ | 3SM | 01 | 01 |
كَتَبَكِ | katábaki | كَتَبَ | 3SM | 01 | 01 |
كَتَبَهُ | katábahu | كَتَبَ | 3SM | 01 | 01 |
كَتَبَهَا | katábaha̱ | كَتَبَ | 3SM | 01 | 01 |
كَتَبَنَا | katábana̱ | كَتَبَ | 3SM | 01 | 01 |
كَتَبَكُمْ | katábakum | كَتَبَ | 3SM | 01 | 01 |
كَتَبَكُنَّ | katabakúnna | كَتَبَ | 3SM | 01 | 01 |
كَتَبَكُمَا | katabákuma̱ | كَتَبَ | 3SM | 01 | 01 |
79 件中 1 から 10 まで表示
使用分野
ArabLEXは、以下のような様々な分野の自然言語処理アプリケーション開発に役立ちます。
機械翻訳
翻訳精度を大幅に向上
形態素解析
アルゴリズムを大幅に簡略化
教育アプリ
活用形自動生成システム
固有表現認識
劇的に改善
関連データベース

アラビア語方言全活用形辞書データベース
主なアラビア語方言をすべてカバー 1億以上の項目を収録

スペイン語全活用形データベース
すべての屈折形、格変化形、活用形を収録

アラビア語単語データベース
一般用語、固有名詞、専門用語