unicode 中的 KK 音標符號

颱風天在家上網,偶然之下看到了 CMU 製作的一個音標資料庫:

The CMU Pronouncing Dictionary

雖然資料已經有點舊了,不過既然資料庫的版權說明寫著可以免費散佈使用,就想說把他拿來放進 cdict.net 裡面好了

網頁是使用 BIG5 編碼的,而顯示這些音標符號時,我又不想跟 YAHOO 字典 一樣,直接用小圖組成音標,所以就找了些資料,想辦法在 BIG5 的網頁下面利用 unicode 顯示這些音標符號

CMU 的資料庫中共用到 40 個音標符號,不過似乎並不是標準的 KK 音標,每個音標符號各以一或兩個英文字母的代碼表示,整份列表是長這個樣子的:

HARBESON  HH AA1 R B IH0 S AH0 N
HARBIN  HH AA1 R B IH0 N
HARBINGER  HH AA1 R B IH0 N JH ER0
HARBINGERS  HH AA1 R B IH0 NG ER0 Z
HARBINSON  HH AA1 R B IH0 N S AH0 N
HARBISON  HH AA1 R B IH0 S AH0 N
HARBOLD  HH AA1 R B OW2 L D
HARBOR  HH AA1 R B ER0

經過與 unicode 比對之後,整理出來的對應表如下:

代碼 音標 Unicode 顯示方式 代碼 音標 Unicode 顯示方式
AA ɑ U+0251 ɑ K k k
AE æ U+00E6 æ L l l
AH ʌ U+028C ʌ M m m
AH0 ə U+0259 ə N n n
AO ɔ U+0254 ɔ NG ŋ U+014B ŋ
AW ɑʊ U+0251
U+028A
ɑ
ʊ
OW o o
AY ɑɪ U+0251
U+026A
ɑ
ɪ
OY ɔɪ U+0254
U+026A
ɔ
ɪ
B b b P p p
CH t U+0283 tʃ R r r
D d d S s s
DH ð U+00F0 ð SH ʃ U+0283 ʃ
EH ɛ U+025B ɛ T t t
ER ɚ U+025A ɚ TH θ U+03B8 θ
  ɝ U+025D ɝ        
EY e e UH ʊ U+028A ʊ
F f f UW u u
G g g V v v
HH h h W w w
IH ɪ U+026A ɪ Y j j
IY i i Z z z
JH d U+0292 dʒ ZH ʒ U+0292 ʒ

其中 ɝ 這個音標並沒有被 CMU 這個資料庫用到,我也不知為什麼,可能是它用的並不是標準的 KK 音標吧

另外,比較奇怪的一點是,使用 Firefox 瀏覽這些 unicode 音標符號都沒有問題,但是使用 Internet Explorer 的話,有部分符號會顯示出不出來(變成一個空白的框框)

經過試驗之後,把字型設定成 Lucida Sans Unicode 就可以了

CMU 這個音標資料庫中還有重音符號在內,只是由於它是標在母音的地方,所以如果沒有經過特殊判斷,直接顯示出來會跟一般字典上的音標表示法不太一樣

  音標 Unicode 顯示方式
重音 ˈ U+02C8 ˈ
次重音 ˌ U+02CC ˌ

這兩個重音符號,在 Firefox 下面一樣沒有問題,但是在 IE 下面,就算用 Lucida Sans Unicode 也是顯示不出來…XD 要用 Arial Unicode MS 才能顯示出來,但是 Arial Unicode MS 反而顯示不出上面的音標符號…

有興趣的人可以到 http://cdict.net/ 上面試用看看

在〈unicode 中的 KK 音標符號〉中有 9 則留言

  1. grief

    Hi, Dada 您好,
    我有個小小疑問喔:
    請問以上音標中 (或 http://cdict.net/ 中),有 “捲舌的3” 這個母音嗎?
    比如 first, third, early, disturb 等字的重音…

    回覆
  2. David

    整理的非常好,不過如果要從已經打好的專屬KK音標字型轉換成unicode的話,處了重打以外,有沒有好的方法?(用替換的方法嗎?)
    另外,在unicode裡面,如果是l,m,下面有一點的,有嗎?謝謝

    回覆

grief 發表迴響取消回覆