颱風天在家上網,偶然之下看到了 CMU 製作的一個音標資料庫:
The CMU Pronouncing Dictionary
雖然資料已經有點舊了,不過既然資料庫的版權說明寫著可以免費散佈使用,就想說把他拿來放進 cdict.net 裡面好了
網頁是使用 BIG5 編碼的,而顯示這些音標符號時,我又不想跟 YAHOO 字典 一樣,直接用小圖組成音標,所以就找了些資料,想辦法在 BIG5 的網頁下面利用 unicode 顯示這些音標符號
CMU 的資料庫中共用到 40 個音標符號,不過似乎並不是標準的 KK 音標,每個音標符號各以一或兩個英文字母的代碼表示,整份列表是長這個樣子的:
HARBESON HH AA1 R B IH0 S AH0 N HARBIN HH AA1 R B IH0 N HARBINGER HH AA1 R B IH0 N JH ER0 HARBINGERS HH AA1 R B IH0 NG ER0 Z HARBINSON HH AA1 R B IH0 N S AH0 N HARBISON HH AA1 R B IH0 S AH0 N HARBOLD HH AA1 R B OW2 L D HARBOR HH AA1 R B ER0
經過與 unicode 比對之後,整理出來的對應表如下:
代碼 | 音標 | Unicode | 顯示方式 | 代碼 | 音標 | Unicode | 顯示方式 |
AA | ɑ | U+0251 | ɑ | K | k | – | k |
AE | æ | U+00E6 | æ | L | l | – | l |
AH | ʌ | U+028C | ʌ | M | m | – | m |
AH0 | ə | U+0259 | ə | N | n | – | n |
AO | ɔ | U+0254 | ɔ | NG | ŋ | U+014B | ŋ |
AW | ɑʊ | U+0251 U+028A |
ɑ ʊ |
OW | o | – | o |
AY | ɑɪ | U+0251 U+026A |
ɑ ɪ |
OY | ɔɪ | U+0254 U+026A |
ɔ ɪ |
B | b | – | b | P | p | – | p |
CH | tʃ | t U+0283 | tʃ | R | r | – | r |
D | d | – | d | S | s | – | s |
DH | ð | U+00F0 | ð | SH | ʃ | U+0283 | ʃ |
EH | ɛ | U+025B | ɛ | T | t | – | t |
ER | ɚ | U+025A | ɚ | TH | θ | U+03B8 | θ |
ɝ | U+025D | ɝ | |||||
EY | e | – | e | UH | ʊ | U+028A | ʊ |
F | f | – | f | UW | u | – | u |
G | g | – | g | V | v | – | v |
HH | h | – | h | W | w | – | w |
IH | ɪ | U+026A | ɪ | Y | j | – | j |
IY | i | – | i | Z | z | – | z |
JH | dʒ | d U+0292 | dʒ | ZH | ʒ | U+0292 | ʒ |
其中 ɝ 這個音標並沒有被 CMU 這個資料庫用到,我也不知為什麼,可能是它用的並不是標準的 KK 音標吧
另外,比較奇怪的一點是,使用 Firefox 瀏覽這些 unicode 音標符號都沒有問題,但是使用 Internet Explorer 的話,有部分符號會顯示出不出來(變成一個空白的框框)
經過試驗之後,把字型設定成 Lucida Sans Unicode 就可以了
CMU 這個音標資料庫中還有重音符號在內,只是由於它是標在母音的地方,所以如果沒有經過特殊判斷,直接顯示出來會跟一般字典上的音標表示法不太一樣
音標 | Unicode | 顯示方式 | |
重音 | ˈ | U+02C8 | ˈ |
次重音 | ˌ | U+02CC | ˌ |
這兩個重音符號,在 Firefox 下面一樣沒有問題,但是在 IE 下面,就算用 Lucida Sans Unicode 也是顯示不出來…XD 要用 Arial Unicode MS 才能顯示出來,但是 Arial Unicode MS 反而顯示不出上面的音標符號…
有興趣的人可以到 http://cdict.net/ 上面試用看看
這個真有用~ 😀
感謝你~
Hi, Dada 您好,
我有個小小疑問喔:
請問以上音標中 (或 http://cdict.net/ 中),有 “捲舌的3” 這個母音嗎?
比如 first, third, early, disturb 等字的重音…
感恩唷! 🙄 🙄
你好像少打了這個0 .0″ →『ɝ U+025D』 😯 😯 😯 😯
感謝傑! ɝ U+025D 已加入
太棒了,謝謝你喔!
正在打教材,很有幫助 😛
整理的非常好,不過如果要從已經打好的專屬KK音標字型轉換成unicode的話,處了重打以外,有沒有好的方法?(用替換的方法嗎?)
另外,在unicode裡面,如果是l,m,下面有一點的,有嗎?謝謝
Look into my page: digital options [federicofgnv.unblog.fr]
good job!