National Electronics and Computer Technology Center Ministry of Science Technology and Environment, Thailand |
Tokyo Institute of Technology, Japan |
ini-con ::= cons | cons consTo construct a converter, we add the outputs to the rules:
cons ::= 'Ê' | '¹'
fnl-cons ::= 'Ê' | '¹'
ini-con ::= cons | cons (e/'a') (e/'Î') consThen, we construct a converter machine from the union set of all rules:
cons ::= ('Ê'/'«') | ('¹'/'¹')
fnl-cons ::= ('Ê'/'´') | ('¹'/'¹')
(1) -à/e-> (5) -Ê/«-> (c) -e/a-> (d) -e/Î-> (e) -¹/¹-> (6) -Ò/a-> (7) -e/Ç-> (8)*which yield soundex codes "«aιaÇ" and "«eιaÎ", respectively.
(1) -à/e-> (5) -Ê/«-> (c) -e/e-> (6) -e/e-> (4) -e/Î-> (8) -e/e-> (1) -¹/¹-> (9) -e/e-> (2) -Ò/a-> (4) -e/Î-> (8)*
ÍѵÃÒ = Íѵà + µÃÒOne quick solution is to provide a short-circuit machanism:
For example, suppose that the original rules are:
TO(label; in/out) at current position, branch an (in/out) edge to label state. TI(label) current position is reachable from label state by an (e/e) edge.
ini-cons ::= ('Í'/'Í') | ('µ'/'µ') | ('µÃ'/'µ')Here the word 'ÍѵµÒ' is valid, but 'ÍѵÃÒ' is still not. However, with the short-circuit notation, we modify the rules like this:
fnl-cons ::= ('µ'/'´') | ('µÃ'/'´')
ini-cons ::= ('Í'/'Í') | ('µ'/'µ') | ('µÃ'/'µ')which yields the following machine:
fnl-cons ::= ('µ'/'´') TO(P; e/'µ') | ('µÃ'/'´') TO(P; e/'µ')
The execution of 'ÍѵÃÒ', which generates the corresponding code 'Ía´µaÎ', is:
(1) -Í/Í-> (2) - Ñ/a-> (3) -µÃ/´-> (6) -e/µ-> (P) -e/e-> (2) -Ò/a-> (4) -e/Î-> (7)*
Words | [Udom83] | [LK82] | [Arun91] | Our Model |
---|---|---|---|---|
ÊÃäì | Ê300000 | «0000 | «¹ | «a¹ |
Êѹ | Ê300000 | «0000 | «¹ | «a¹, «a¹¹aÎ |
ºØÒ
|
º330000*
|
ºE490
|
ºÙ¹Ò*
|
ºu¹ÂaÎ, ºuÎÂo¹ÂaÎ, ºu¹ÂaÎÂaÎ, ºuÎÂcÎÂaÎ, ºuÎÂaÎÂaÎ, ºu¹ÂaÎ |
ºØ³ÂÒ | º320000* | ºE490 | ºÙ¹ÂÒ* | ºu¹ÂaÎ, ºu¹¹aÎÂaÎ, ºuιcÎÂaÎ, ºuιaÎÂaÎ |
ÊѺ»Ðô | Ê559400* | «5430* | «ºº¹´* | «aº»aÎÅo´, «aººaλaÎÅo´´aÎ, «aº»aÎÅo´´aÎ, «aººaλaÎÅcδcÎ, «aººaλaÎÅaδcÎ, «aº»aÎÅcδcÎ, «aº»aÎÅaδcÎ, «aººaλaÎÅcδaÎ, «aººaλaÎÅaδaÎ, «aº»aÎÅcδaÎ, «aº»aÎÅaδaÎ, «aººaλaÎÅo´ |
ÊÑ»ÃÊ | Ê594000* | «5300* | «º¹´* | «aº»aÎÅo´, «aº»aÎÅo´«aÎ, «aºÅo´«aÎ, «aº»aΫcÎ, «aº«cÎ, «aº»aÎÅcΫcÎ, «aº»aÎÅaΫcÎ, «aºÅcΫcÎ, «aºÅaΫcÎ, «aº»aΫaÎ, «aº«aÎ, «aº»aÎÅcΫaÎ, «aº»aÎÅaΫaÎ, «aºÅcΫaÎ, «aºÅaΫaÎ, «aºÅo´ |
ä´é | ´000000* | ´7000* | ´ä* | ´a |
´éÒÂ | ´200000* | ´9700* | ´ÒÂ* | ´aÂ, ´aÂÂaÎ, ´aÎÂcÎ, ´aÎÂaÎ |
¡éÒÇ | ¡000000 | ¡9700* | ¡ÒÇ* | ¡aÇ, ¡aÇÇaÎ, ¡aÎÇcÎ, ¡aÎÇaÎ |
à¡éÒ | ¡000000 | ¡B900* | ¡Òà* | ¡aÇ |
¨Ã | ¨900000* | ¨0000* | ¨¹* | ¨c¹, ¨cÎÅcÎ, ¨aÎÅcÎ, ¨cÎÅaÎ, ¨aÎÅaÎ |
¨Í¹ | ¨630000* | ¨4000* | ¨Í¹* | ¨c¹, ¨c¹¹aÎ,
¨cÎÍo¹¹aÎ, ¨aÎÍo¹¹aÎ,
¨cιcÎ, ¨cÎÍcιcÎ,
¨aÎÍcιcÎ, ¨cÎÍaιcÎ,
¨aÎÍaιcÎ,
¨cιaÎ, ¨cÎÍcιaÎ, ¨aÎÍcιaÎ, ¨cÎÍaιaÎ, ¨aÎÍaιaÎ, ¨cÎÍo¹, ¨aÎÍo¹ |
¸ÃÃÁÐ | ·300000* | ·6000 | ·¹Á* | ·aÁÁaÎ, ·a¹ÁaÎ, ·c¹ÅoÁÁaÎ, ·c¹ÅcÎÁaÎ, ·c¹ÅaÎÁaÎ, ·cÎÅcÎÅoÁÁaÎ, ·aÎÅcÎÅoÁÁaÎ, ·cÎÅaÎÅoÁÁaÎ, ·aÎÅaÎÅoÁÁaÎ, ·cÎÅcÎÅcÎÁaÎ, ·aÎÅcÎÅcÎÁaÎ, ·cÎÅaÎÅcÎÁaÎ, ·cÎÅcÎÅaÎÁaÎ, ·aÎÅaÎÅcÎÁaÎ, ·aÎÅcÎÅaÎÁaÎ, ·cÎÅaÎÅaÎÁaÎ, ·aÎÅaÎÅaÎÁaÎ |
¸ÑÁÁÐ | ·000000* | ·6000 | ·Á* | ·aÁÁaÎ, ·aÁÁaÎÁaÎ |
Comparison on Different Words Separation:
Words | [Udom83] | [LK82] | [Arun91] | Our Model |
---|---|---|---|---|
»ÑÒ | »330000* | »4900* | »¹Ò* | »a¹ÂaÎ, »a¹ÂaÎÂaÎ |
»Ñ¹¹Ò | »330000* | »4900* | »¹Ò* | »a¹¹aÎ, »a¹¹aιaÎ |
ÊÕÊéÁ | Ê400000* | «3600* | «Õ´Á* | «iΫoÁ, «iΫoÁÁaÎ, «iΫcÎÁcÎ, «iΫcÎÁaÎ |
ÊÕ´Ó | Ê400000* | «3600* | «Õ´Á* | «iδaÁ |
¡éÁ | ¡000000* | ¡6000 | ¡Á | ¡oÁ, ¡oÁÁaÎ, ¡cÎÁcÎ, ¡cÎÁaÎ |
à¡Á | ¡000000* | ¡B600 | ¡Áà | ¡eÁ, ¡eÁÁaÎ, ¡eÎÁcÎ, ¡eÎÁaÎ, ¡aÎÁeÎ |
¡ÔèÇ | ¡000000* | ¡7000 | ¡Ç | ¡iÇ, ¡iÇÇaÎ, ¡iÎÇcÎ, ¡iÎÇaÎ |
ËÔÇ | Ë000000* | Ë7000* | ËÇ* | ÎiÇ, ÎiÇÇaÎ, ÎiÎÇcÎ, ÎiÎÇaÎ |
ËÑÇ | Ë000000* | Ë7000* | ËÇ* | Î$Î |
¡ÃÃä¡Ã | ¡319000 | ¡7100* | ¡¹¡ä | ¡a¹¡aÂ, ¡a¹¡aÎÅaÂ, ¡a¹ÅaΡaÂ, ¡c¹ÅaΡaÂ, ¡aÎÅaÎÅaΡaÂ, ¡c¹ÅaΡaÂÅaÎ, ¡cÎÅcÎÅcΡaÎÅaÂ, ... |
¡ÃÐÂÔ¡ | ¡921000 | ¡7100* | ¡Â¡ | ¡aÎÂi¡, ¡aÎÂi¡¡aÎ, ¡cÎÅaÎÂi¡¡aÎ, ¡aÎÅaÎÂi¡¡aÎ, ¡aÎÂiΡcÎ, ¡cÎÅaÎÂiΡcÎ, ¡aÎÅaÎÂiΡcÎ, ¡aÎÂiΡaÎ, ¡cÎÅaÎÂiΡaÎ, ¡aÎÅaÎÂiΡaÎ, ¡cÎÅaÎÂi¡, ¡aÎÅaÎÂi¡ |
¡ÇÕÂÑ¡Éì | ¡021000 | ¡7100* | ¡Õ¡ | ¡aÎÇiÎÂa¡, ¡iÎÂa¡, ¡cÎÇiÎÂa¡ |
¨ÕÇà | ¨090000 | ¨7000* | ¨Õǹ | ¨iÎÇc¹, ¨iÎÇcÎÅcÎ, ¨iÎÇaÎÅcÎ, ¨iÎÇcÎÅaÎ, ¨iÎÇaÎÅaÎ |
㨠| ¨000000 | ¨7000* | ¨ã | ¨a |
ÇԹѠ| Ç320000 | Ç4700* | ǹä* | ÇiιaÂ, Çi¹¹aÂÂaÎ, ÇiιaÂÂaÎ, Çi¹¹a |
ÇÅÑ | Ç920000 | Ç4700* | ǹä* | ÇaÎÅaÂ, Ço¹ÅaÂÂaÎ, ÇcÎÅaÂÂaÎ, ÇaÎÅaÂÂaÎ, Ço¹ÅaÂ, ÇcÎÅa |
Last Updated: 1997-10-28 Theppitak Karoonboonyanan |