ヘッダーをスキップ

Oracle Content Management SDK 管理者ガイド
10g(9.0.4.2)
B15638-01
目次
目次
索引
索引

戻る 次へ

I グローバリゼーション・サポート

この付録では、Oracle CM SDKのグローバリゼーション・サポートについて説明します。この付録の項目は次のとおりです。

グローバリゼーション・サポートの概要

Oracle Content Management SDK (Oracle CM SDK)のグローバリゼーション・サポートにより、単一のOracle CM SDKインスタンス内で、異なるキャラクタ・セットや言語を使用したドキュメントを格納および検索できます。また、世界中のどこからでも同時にアクセスし実行できる、多言語アプリケーションを開発するための、基盤が提供されます。ユーザー・インタフェースのコンテンツのレンダリングとデータの処理は、ユーザーのネイティブ言語とロケールの設定で行われます。グローバリゼーション・サポートにより、リソース文字列、エラー・メッセージ、ソート順、日付、時刻、通貨、数値およびカレンダ表記規則が、自動的にネイティブ言語およびネイティブ・ロケールに適応します。

リポジトリ

リポジトリはOracle CM SDKのコア実装であり、この上にプロトコル・サーバーとアプリケーションが構築されています。グローバリゼーション・サポートは、他の依存コンポーネントが共有し利用できるように、リポジトリ内に提供されています。リポジトリでのグローバリゼーション・サポートの主な目的は、異なるキャラクタ・セットや言語を使用したドキュメントを効率的に格納し、これらのドキュメント上で効果的な更新や検索を可能にすることです。

Oracle CM SDKにおけるデータベース・キャラクタ・セットの選択方法

リポジトリでは、ドキュメント名や説明などのすべてのメタデータ文字列は、OracleデータベースのVARCHAR2データ型で格納されます。このデータ型で格納された文字列は、データベースの作成時に指定されたデータベース・キャラクタ・セットにエンコードされます。ただし、ドキュメント自体は構造化されていないデータであるため、Oracleデータベースのラージ・オブジェクト・データ型の1つ(特にBLOBデータ型)として格納されます。BLOBデータ型はコンテンツをそのまま格納するため、ドキュメントのコンテンツのキャラクタ・セットは変換されません。LONGデータ型およびCLOBデータ型は、データベース・キャラクタ・セットでコンテンツを格納するため、キャラクタ・セットの変換が必要となります。変換の際は、データ整合性が損われたり、文字が誤って変換されたり損失したりする可能性があります。

ドキュメントのコンテンツに組み込まれている全文検索索引は、データベース・キャラクタ・セットにエンコードされます。ドキュメントのコンテンツが索引付けされると、BLOBデータはコンテンツのキャラクタ・セットからデータベース・キャラクタ・セットに変換され、索引テキスト・トークンが作成されます。コンテンツのキャラクタ・セットがデータベース・キャラクタ・セットのサブセットでない場合は、変換時にガベージ・トークンが生成されます。たとえば、データベース・キャラクタ・セットISO-8859-1(西ヨーロッパ系言語)は、Shift-JIS(日本語)のドキュメントを正しく索引付けできません。コンテンツを有効に検索するには、データベース・キャラクタ・セットの選択時に、ユーザーが格納するドキュメントのキャラクタ・セットを考慮する必要があります。

Oracle CM SDKインスタンスに多言語ドキュメントが含まれる場合は、データベース・キャラクタ・セットにUTF-8を使用することをお薦めします。UTF-8は、Unicode規格で定義された文字をサポートします。Unicode規格を使用すると、同一アプリケーションまたは同一データベース内に様々な言語が含まれる場合の問題が解決されます。Unicodeは単一のグローバルなキャラクタ・セットで、主要な既存文字がすべて含まれ、国際標準に準拠しています。Unicodeでは、プラットフォーム、プログラムまたは言語に関係なく、すべての文字に一意のコード値が付けられます。UTF-8は、Unicodeの8ビット・エンコード方式です。このエンコード方式は可変長で、ASCIIの厳密なスーパーセットです。UTF-8では、1つのUnicode文字は、1、2、3または4バイトでエンコードされます。ヨーロッパ系のスクリプトの文字は、1または2バイトで表されます。アジア系のスクリプトの文字は、3バイトで表されます。補助文字は4バイトで表されます。Unicodeベースのファイル・システムを使用すると、1つのシステムで異なる言語プリファレンスを使用するユーザー同士で、様々な言語を使用したドキュメントのコンテンツやメタデータを共有できます。

Oracleデータベースでは、新しいキャラクタ・セットAL32UTF-8が採用されています。リリース1では、AL32UTF-8はUnicode 3.0を配置するためのデフォルト・キャラクタ・セットです。リリース2では、AL32UTF-8は最新のUnicode 3.1規格に準拠しており、補助文字、特に中国語、日本語および韓国語の表意文字が追加されています。AL32UTF-8は、Oracleデータベースのインストール時のデフォルト・キャラクタ・セットです。


注意

Oracle CM SDKでは、AL32UTF-8データベースはサポートされません。Oracle Textでは、AL32UTF-8データベース上の中国語、日本語および韓国語のレクサーがサポートされていないためです。Unicodeベースのファイル・システムでは、データベース・キャラクタ・セットにUTF-8を使用することをお薦めします。Oracle CM SDKがAL32UTF-8データベースにインストールされている場合、中国語、日本語または韓国語のドキュメントは索引付けされないため、検索できません。

Oracle CM SDK Configuration Assistantは、AL32UTF-8データベースに対し、中国語、日本語または韓国語のロケール処理ができません。これは、データベース・セッション言語がアジア系言語に初期化されている場合、Oracle Textが米語の場合とは異なる動作をするためです。JDBCは、実行中のアプリケーション(この場合は構成用ツール)のロケールに従って、データベース・セッション言語を初期化します。 


Oracle CM SDKでドキュメントが正しく索引付けされたことを確認する方法

リポジトリは、単一のファイル・システムで異なるキャラクタ・セットや言語を使用したドキュメントをサポートするために、ドキュメントごとに2つのグローバリゼーション属性を関連付けます。その属性とは、キャラクタ・セット属性と、言語属性です。

キャラクタ・セット

ドキュメントのキャラクタ・セットの用途はいくつかあります。あるファイルにドキュメントのコンテンツがレンダリングされるときは、ドキュメントのキャラクタ・セットが、そのファイルの文字コードとして使用されます。ドキュメントがブラウザに表示されるときは、ドキュメントのキャラクタ・セットがHTTPコンテンツ・タイプ・ヘッダーに設定されます。さらに、テキスト・ドキュメントに全文検索が組み込まれた場合、Oracle Textは、ドキュメントのキャラクタ・セットを使用して、データをデータベース・キャラクタ・セットに変換してから索引を作成します。キャラクタ・セットが更新されると、コンテンツは再度索引付けされます。

ドキュメントの挿入時にキャラクタ・セットが指定されない場合、リポジトリは次のようにデフォルト・キャラクタ・セットを決定します。Localizerオブジェクトに格納されている、ユーザーのLibrarySessionのキャラクタ・セットが最初に使用されます。これは、ユーザーのLibrarySessionの初期化の際に、ユーザーのプライマリ・ユーザー・プロファイル情報から取得されます。初期化中に、ユーザーのプライマリ・ユーザー・プロファイルにキャラクタ・セットのデフォルト値が見つからない場合、Oracle CM SDKシステム全体のデフォルト・キャラクタ・セットからデフォルトが取得されます。これは、サービス構成プロパティIFS.SERVICE.DefaultCharacterSetで指定されています。

キャラクタ・セットの様々なネーミング規則も重要です。Oracle CM SDK Java APIでは、Javaのネーミング規則がキャラクタ・セットに標準化されています。GUIエンド・ユーザー・アプリケーションでは、広く知られているIANAネーミング規則が一般的に採用されています。キャラクタ・セット名については、「Oracle CM SDKでサポートされているキャラクタ・セット」を参照してください。

言語

ドキュメントの言語は、主に2つの用途で使用されます。1つ目の用途として、特定言語のドキュメントの検索を制限する基準として使用されます。さらに重要な2つ目の用途は、Oracle Textを使用してドキュメントに全文検索索引を作成することです。Oracle Textのマルチレクサー機能では、言語を使用して特定のレクサーを識別し、検索可能な単語でドキュメントを解析します。言語固有のレクサーは、索引が構築される前に定義され、言語と関連付けられる必要があります。言語固有のレクサーは、次のように定義されます。

表I-1    言語固有のレクサー 
言語  レクサー  レクサーのオプション 

ポルトガル語(ブラジル) 

BASIC_LEXER 

BASE LETTER 

フランス語(カナダ) 

BASIC_LEXER 

BASE LETTER

INDEX THEME 

デンマーク語 

BASIC_LEXER 

BASE LETTER

DANISH ALTERNATE SPELLING 

オランダ語 

BASIC_LEXER 

BASE LETTER 

フィンランド語 

BASIC_LEXER 

BASE LETTER 

フランス語 

BASIC_LEXER 

BASE LETTER

INDEX THEME

THEME

LANGUAGE=FRENCH 

ドイツ語 

BASIC_LEXER 

BASE LETTER

GERMAN ALTERNATE SPELLING 

イタリア語 

BASIC_LEXER 

BASE LETTER 

日本語 

JAPANESE_VGRAM_LEXER 

  

韓国語 

KOREAN_LEXER 

  

スペイン語(南米) 

BASIC_LEXER 

BASE LETTER 

ポルトガル語(スペイン) 

BASIC_LEXER 

BASE LETTER 

簡体字中国語 

CHINES_VGRAM_LEXER 

  

スウェーデン語 

BASIC_LEXER 

BASE LETTER

SWEDISH ALTERNATE SPELLING 

繁体字中国語 

CHINESE_VGRAM_LEXER 

  

その他 

BASIC_LEXER 

INDEX THEME

THEME LANGUAGE=ENGLISH

INDEX TEXT 

BASIC_LEXERは、空白を単語の区切りとして使用するシングルバイト言語で使用されます。アジア系言語のレクサーでは、空白を単語の区切りには使用できません。かわりに、V-GRAMアルゴリズムを使用して、検索可能なキーでドキュメントを解析します。Oracle Textでサポートされていない言語は、英語として解析されます。Oracle CM SDKでは、Oracle Textのマルチレクサー機能が使用されます。これは、ドイツ語、オランダ語、スウェーデン語、日本語、簡体字中国語、繁体字中国語および韓国語のサブレクサーを含む、グローバルなレクサーです。

ドキュメントの挿入時に言語が指定されない場合、リポジトリは次のようにデフォルト言語を決定します。

  1. キャラクタ・セットが設定されているときは、多くの場合、キャラクタ・セット値に基づく適切なアルゴリズムによって言語を取得できます。たとえば、Shift-JISのキャラクタ・セットを使用しているドキュメントであれば、日本語である可能性が高いと言えます。

  2. デフォルト言語は、ユーザーのLibrarySessionのLocalizerから取得されます。LibrarySessionの初期化中は、ユーザーのプライマリ・ユーザー・プロファイルからデフォルト言語が取得されます。

  3. 最後の手段として、Oracle CM SDKシステム全体のデフォルト言語が取得されます。これは、サービス構成プロパティIFS.SERVICE.DefaultLanguageで指定されています。

言語のネーミング規則は1種類のみで、Oracleのグローバリゼーション・サポート言語の略称です。Oracle CM SDKでサポートされている言語のリストについては、「Oracle CM SDKでサポートされている言語」を参照してください。

サービス構成プロパティ

Oracle CM SDKインスタンスのデフォルト・キャラクタ・セットおよびデフォルト言語の値を保持するサービス構成プロパティが2つあります。それらは次のプロパティです。

これら2つのプロパティは、Oracle CM SDK Configuration Assistantツールによって初期化されますが、後でApplication Server Controlを介して変更できます。Oracle CM SDKデフォルト・キャラクタ・セットは、データベース・キャラクタ・セットと同じか、またはそのサブセットである必要があります。キャラクタ・セットは、IANA標準ネーミング規則に準拠して指定する必要があります。また、言語は、Oracleの言語ネーミング規則に準じて指定する必要があります。Oracle CM SDKでサポートされているキャラクタ・セットおよび言語のリストについては、「Oracle CM SDKでサポートされているキャラクタ・セット」および「Oracle CM SDKでサポートされている言語」を参照してください。

多言語ドキュメントの検索方法

ドキュメントを言語特性に基づいて正確に検索するには、検索される文字列の言語をOracle Textが認識している必要があります。この点について、Oracle CM SDK Java APIでは、oracle.ifs.bean.searchクラスにsearch.open(String language)という新しいメソッドが提供され、アプリケーションが検索文字列の言語を指定できるようになりました。

search.open()メソッドに言語を指定して言語別の検索を通知すると、Oracle CM SDKリポジトリは、SELECT文を発行してコンテキスト検索を開始する前に、次のようなSQL文をデータベースに発行し、NLS_LANGUAGEセッション・パラメータを変更します。

ALTER SESSION SET NLS_LANGUAGE=nls_language

Oracle Textは、nls_language変数を確認し、解析される検索文字列の言語を決定します。検索が終了するか、またはsearch.close()メソッドがコールされると、Oracle CM SDKリポジトリは別のALTER SESSION SQLコマンドを発行し、NLS_LANGUAGEセッション・パラメータを元の値に変更します。

条件式は、データベース・セッション言語に適したサブレクサーを使用して解析されます。たとえば、データベース・セッション言語がドイツ語の場合、ドイツ語のサブレクサー・プリファレンスを使用してCONTAINS問合せが解析されます。

Oracle CM SDKプロトコル

一部のプロトコルでは、マルチバイトのユーザー名はサポートされていません。WebDAV(WebフォルダおよびOracle FileSync)、HTTP、SMBおよびIMAPを介したアクセスでは、マルチバイト・キャラクタを含むユーザー名は使用できません。FTPおよびCUPプロトコルでは、マルチバイトのユーザー名が使用できます。また、ユーザー・パスワードがASCIIキャラクタであることを強要するプロトコルもあります。

プロトコル・コマンドのキャラクタ・セットは、ドキュメントのデフォルト・キャラクタ・セットと異なっていてもかまいません。プロトコル・コマンドのキャラクタ・セットとは、FTPやNFSなどのプロトコルでコマンドを入力する際に使用するキャラクタ・セットのことです。

FTP

Oracle CM SDKには、デフォルトのFTPコマンド・キャラクタ・セットを指定するために、次のサーバー構成プロパティが用意されています。

セッションのFTPコマンド文字コードは、次の優先順位モデルで決定されます。

  1. 明示的に指定する(quote setcommandcharactersetコマンドを使用)。

  2. IFS.SERVER.PROTOCOL.FTP.CommandCharacterSetIsUserCharacterSetがtrueの場合、プライマリ・ユーザー・プロファイルのCharacterSet属性の値を使用する。

  3. IFS.SERVER.PROTOCOL.FTP.CommandCharacterSetIsUserCharacterSetがfalseの場合、IFS.SERVER.PROTOCOL.FTP.DefaultCommandCharacterSetの値を使用する。

  4. キャラクタ・セットが見つからない場合は、サービス全体のデフォルトであるIFS.SERVICE.DefaultCharacterSetを使用する。

標準のFTPプロトコルでは、FTPコマンドの引数として通常渡されるファイル名やディレクトリ名のキャラクタ・セットを定義していません。FTPサーバーが、FTPコマンドのバイト・シーケンスを解析する役割を担っています。ユーザーがキャラクタ・セットや言語の異なるドキュメントにアクセスできるようにするため、およびプロトコル・コマンドのキャラクタ・セットを設定および表示できるようにするために、Oracle CM SDK FTPサーバーには次のQUOTEコマンドが用意されています。

FTPセッションのキャラクタ・セットまたは言語を変更するためにquoteコマンドを発行すると、実際には、FTPサーバーにより、現在のLibrarySessionのLocalizerオブジェクトの設定が更新されます。その後、FTPセッションが確立されるまでquoteコマンドは発行されないため、キャラクタ・セットまたはFTPサーバーのデフォルト・キャラクタ・セットのサブセットに基づいたユーザー名のみが、FTPサーバーへのログインに使用できます。quoteコマンドの詳細は、付録E「FTPのquoteコマンド・リファレンス」を参照してください。

ユーザーは、標準のコマンドラインFTPクライアントを使用して、自分の環境のキャラクタ・セットおよび言語を指定できます。Internet ExplorerやNetscapeなどのブラウザベースのFTPクライアントでは、quoteコマンドは発行できません。この場合、FtpSessionのデフォルトが使用されます。

WebDAV

Oracle CM SDKには、デフォルトのWebDAVコマンド・キャラクタ・セットを指定するために、次のサーバー構成プロパティが用意されています。

セッションのWebDAVコマンド文字コードは、次の優先順位モデルで決定されます。

  1. IFS.SERVER.PROTOCOL.DAV.Webfolders.CommandCharacterSetIsUserCharacterSetがtrueの場合、プライマリ・ユーザー・プロファイルのCharacterSet属性の値を使用する。

  2. IFS.SERVER.PROTOCOL.DAV.Webfolders.CommandCharacterSetIsUserCharacterSetがfalseの場合、IFS.SERVER.PROTOCOL.DAV.Webfolders.DefaultCommandCharacterSetの値を使用する。

  3. キャラクタ・セットが見つからない場合は、サービス全体のデフォルトであるIFS.SERVICE.DefaultCharacterSetを使用する。

NFS

Oracle CM SDKには、デフォルトのNFSコマンド・キャラクタ・セットを指定するために、次のサーバー構成プロパティが用意されています。

セッションのNFSコマンド文字コードは、次の優先順位モデルで決定されます。

  1. IFS.SERVER.PROTOCOL.NFS.CommandCharacterSetIsUserCharacterSetがtrueの場合、プライマリ・ユーザー・プロファイルのCharacterSet属性の値を使用する。

  2. IFS.SERVER.PROTOCOL.NFS.CommandCharacterSetIsUserCharacterSetがfalseの場合、IFS.SERVER.PROTOCOL.NFS.DefaultCommandCharacterSetの値を使用する。

  3. キャラクタ・セットが見つからない場合は、サービス全体のデフォルトであるIFS.SERVICE.DefaultCharacterSetを使用する。

SMB

Server Message Block(SMB)プロトコル・サーバーには、Oracle CM SDKをMicrosoft社Windowsエクスプローラのディスク・ドライブとしてマウントできるようにするSMBプロトコルが実装されています。Microsoft社では、LanManagerバージョン0.12から、SMBプロトコルのUnicodeサポートを開始しています。

SMBプロトコルでは、ユーザーは、キャラクタ・セットおよび言語の情報をサーバーに渡すことはできません。SMBプロトコルを介してリポジトリに挿入されるドキュメントには、セッション・デフォルトが使用されます。

IMAP/SMTP

電子メールのメッセージ・フォーマットは、RFC822仕様に準拠します。Oracle CM SDKリポジトリでは、IMAP4およびSMTPプロトコル・サーバー用のRFC822パーサーおよびRFC822メッセージ・レンダラが提供されており、電子メール・メッセージの解析とレンダリングが可能です。RFC822仕様では、非ASCIIメッセージ・ヘッダーの国際化機能が拡張されています。詳細は、RFC2047(MIME Part Three: Message Header Extensions for Non-ASCII Text)を参照してください。また、IMAP4プロトコル・サーバーは、RFC2060(Internet Message Access Protocolバージョン4rev1)を実装し、多言語のメール・フォルダ名をサポートしています。

そのため、電子メール・ユーザーは、非ASCIIのメッセージ・サブジェクト・ヘッダー、非ASCIIのメール・ボックス名、そして様々なキャラクタ・セットのメッセージ・コンテンツを使用できます。

CUP

コマンドライン・ユーティリティ・プロトコル(CUP)サーバーには、独自のCUPプロトコルが実装されています。このプロトコルでは、ユーザーがUNIXシェルやコマンド・プロンプト・ウィンドウなどのコマンドライン環境からOracle CM SDKリポジトリへアクセスできます。CUPサーバーには、専用のCUPクライアントが必要です。CUPクライアントの役割は、CUPサーバーにコマンドを送り、サーバーからコンソールに結果をリダイレクトすることです。様々なキャラクタ・セットのクライアントをサポートするため、CUPクライアントおよびCUPサーバーは、ローカライズされたメッセージをサポートし、CUPセッションのキャラクタ・セットと言語を指定するコマンドを提供します。

CUPコマンドは、Unicodeでサポートされている言語を使用したファイル名やフォルダ名をサポートするため、すべてUTF-8でエンコードされています。CUPサーバーおよびCUPクライアントは、CUPコマンドに対応するため、UTF-8でエンコードされたJavaストリーム・ライターおよびリーダーを作成することによって、UTF-8を実現します。

ローカライズされたメッセージのうち、どれをCUPクライアントに戻すかを決定するために、ログイン時に、クライアント・コンピュータのデフォルトのJavaロケールがCUPサーバーに渡されます。この値は、Localizerのロケール変数の設定で使用されます。

FTPと同様に、現在のセッションのキャラクタ・セットと言語を取得または設定するCUPコマンドがあります。

Oracle CM SDKでサポートされているキャラクタ・セット

Oracle CM SDKでサポートされているキャラクタ・セットを次の表に示します。

表I-2    Oracle CM SDKでサポートされているキャラクタ・セット  
言語  IANA推奨MIMEキャラクタ・セット  IANA追加別名  Javaエンコード  Oracleキャラクタ・セット 

アラビア語(ISO) 

iso-8859-6 

ISO_8859-6:1987、iso-ir-127、ISO_8859-6、ECMA-114、ASMO-708、arabic、csISOLatinArabic 

ISO8859_6 

AR8ISO8859P6 

アラビア語(Windows) 

windows-1256 

なし 

Cp1256 

AR8MSWIN1256 

バルト語(ISO) 

iso-8859-4 

csISOLatin4、iso-ir-110、ISO_8859-4、ISO_8859-4:1988、l4、latin4 

ISO8859_4 

NEE8ISO8859P4 

バルト語(Windows) 

windows-1257 

なし 

Cp1257 

BLT8MSWIN1257 

中央ヨーロッパ語(DOS) 

ibm852 

cp852、852、csPcp852 

Cp852 

EE8PC852 

中央ヨーロッパ語(ISO) 

iso-8859-2 

csISOLatin2、iso-ir-101、iso8859-2、iso_8859-2、iso_8859-2:1987、l2、latin2 

ISO8859_2 

EE8ISO8859P2 

中央ヨーロッパ語(Windows) 

windows-1250 

x-cp1250 

Cp1250 

EE8MSWIN1250 

中国語 

iso-2022-cn

(IANAでは定義されていないが、MIMEドキュメントで使用される) 

csISO2022CN 

ISO2022CN 

ISO2022-CN 

簡体字中国語(GB2312) 

gb2312 

chinese、csGB2312、csISO58GB231280、GB2312、GB_2312-80、iso-ir-58 

EUC_CN 

ZHS16CGB231280 

簡体字中国語(GB18030) 

GB18030 

なし 

GB18030 

ZHS32GB18030 

簡体字中国語(Windows) 

GBK 

windows-936 

GBK 

ZHS16GBK 

繁体字中国語 

big5 

csbig5、x-x-big5 

Big5 

ZHT16BIG5 

繁体字中国語 

windows-950 

なし 

MS950 

ZHT16MSWIN950 

繁体字中国語(EUC-TW) 

EUC-TW 

なし 

EUC_TW 

ZHT32EUC 

繁体字中国語(Big5-HKSCS) 

Big5-HKSCS 

なし 

Big5_HKSCS 

ZHT16HKSCS 

キリル文字(DOS) 

ibm866 

cp866、866、csIBM866 

Cp866 

RU8PC866 

キリル文字(ISO) 

iso-8859-5 

csISOLatinCyrillic、cyrillic、iso-ir-144、ISO_8859-5、ISO_8859-5:1988 

ISO8859_5 

CL8ISO8859P5 

キリル文字(KOI8-R) 

koi8-r 

csKOI8R、koi 

KOI8_R 

CL8KOI8R 

キリル・アルファベット(Windows) 

windows-1251 

x-cp1251 

Cp1251 

CL8MSWIN1251 

ギリシア語(ISO) 

iso-8859-7 

csISOLatinGreek、  ECMA-118、ELOT_928、greek、greek8、iso-ir-126、ISO_8859-7、ISO_8859-7:1987、csISOLatinGreek 

ISO8859_7 

EL8ISO8859P7 

ギリシア語(Windows) 

windows-1253 

なし 

Cp1253 

EL8MSWIN1253 

ヘブライ語(ISO) 

iso-8859-8 

csISOLatinHebrew、hebrew、iso-ir-138、ISO_8859-8、visual、ISO-8859-8 Visual、ISO_8859-8:1988 

ISO8859_8 

IW8ISO8859P8 

ヘブライ語(Windows) 

windows-1255 

なし 

Cp1255 

IW8MSWIN1255 

日本語(JIS) 

iso-2022-jp 

csISO2022JP 

ISO2022JP 

ISO2022-JP 

日本語(EUC) 

euc-jp 

csEUCPkdFmtJapanese、Extended_UNIX_Code_Packed_Format_for_Japanese、x-euc、x-euc-jp 

EUC_JP 

JA16EUC 

日本語(Shift-JIS) 

shift_jis 

csShiftJIS、csWindows31J、ms_Kanji、shift-jis、x-ms-cp932、x-sjis 

MS932 

JA16SJIS 

韓国語 

ks_c_5601-1987 

csKSC56011987、korean、ks_c_5601、euc-kr、csEUCKR 

EUC_KR 

KO16KSC5601 

韓国語(ISO) 

iso-2022-kr 

csISO2022KR 

ISO2022KR 

ISO2022-KR 

韓国語(Windows) 

windows-949 

なし 

MS949 

KO16MSWIN949 

南ヨーロッパ語(ISO) 

iso-8859-3 

ISO_8859-3、ISO_8859-3:1988、iso-ir-109、latin3、l3、csISOLatin3 

ISO8859_3 

SE8ISO8859P3 

タイ語 

TIS-620 

windows-874 

TIS620 

TH8TISASCII 

トルコ語(Windows) 

windows-1254 

なし 

Cp1254 

TR8MSWIN1254 

トルコ語(ISO) 

iso-8859-9 

latin5、l5、csISOLatin5、ISO_8859-9、iso-ir-148、ISO_8859-9:1989 

ISO8859_9 

WE8ISO8859P9 

Universal(UTF-8) 

utf-8 

unicode-1-1-utf-8、unicode-2-0-utf-8、x-unicode-2-0-utf-8 

UTF8 

UTF8 

Unicode(UTF-16BE) 

UTF-16BE 

なし 

UTF-16BE 

AL16UTF16 

Unicode(UTF-16LE) 

UTF16LE 

なし 

UTF-16LE 

AL16UTF16LE 

ベトナム語(Windows) 

windows-1258 

なし 

Cp1258 

VN8MSWIN1258 

西ヨーロッパ言語(Windows) 

windows-1252 

x-ansi 

Cp1252 

WE8MSWIN1252 

西ヨーロッパ言語 

iso-8859-1 

cp819、ibm819、iso-ir-100、iso8859-1、iso_8859-1、iso_8859-1:1987、latin1、l1、csISOLatin1 

ISO8859_1 

WE8ISO8859P1 

西ヨーロッパ言語(DOS) 

ibm850 

cp850、850、csIBM850 

Cp850 

WE38PC850 

Oracle CM SDKでサポートされている言語

Oracle CM SDKでサポートされている言語を次の表に示します。

表I-3    Oracle CM SDKでサポートされている言語 
Oracle言語名  Javaロケール  ISOロケール 

アラビア語 

ar 

ar 

ベンガル語 

bn 

bn 

ポルトガル語(ブラジル) 

pt_BR 

pt-br 

ブルガリア語 

bg 

bg 

フランス語(カナダ) 

fr_CA 

fr-CA 

カタロニア語 

ca 

ca 

クロアチア語 

hr 

hr 

チェコ語 

cs 

cs 

デンマーク語 

da 

da 

オランダ語 

nl 

nl 

エジプト語 

ar_EG 

ar-eg 

米語 

en 

en 

英語 

en_GB 

en-gb 

エストニア語 

et 

et 

フィンランド語 

fi 

fi 

フランス語 

fr 

fr 

ドイツ語 

de  

de  

ギリシア語 

el  

el  

ヘブライ語 

he 

he 

ハンガリー語 

hu 

hu 

アイスランド語 

is 

is 

インドネシア語 

id 

in 

イタリア語 

it 

it 

日本語 

ja 

ja 

韓国語 

ko 

ko 

スペイン語(南米) 

es 

es 

ラトビア語 

lv 

lv 

リトアニア語 

lt 

lv 

マレー語 

ms 

ms 

スペイン語(メキシコ) 

es_MX 

es-mx 

ノルウェー語 

no 

no 

ポーランド語 

pl 

pl 

ポルトガル語 

pt 

pt 

ルーマニア語 

ro 

ro 

ロシア語 

ru 

ru 

簡体字中国語 

zh_CN 

zh-cn 

スロバキア語 

sk  

sk  

スロベニア語 

sl  

sl  

スペイン語 

es_ES  

es-es 

スウェーデン語 

sv  

sv  

タイ語 

th  

th  

繁体字中国語 

zh_TW  

zh-tw 

トルコ語 

tr  

tr  

ウクライナ語 

uk 

uk 

ベトナム語 

vi  

vi  


戻る 次へ
Oracle
Copyright © 2005 Oracle Corporation.

All Rights Reserved.
目次
目次
索引
索引