当前位置:首页 > 电商 > 正文

ymjihe(机核网)

摘要: 拼音分词算法 C语言 #include #define M_JUZI 200//一个树图的链表验证结构//树是由图的链式存储构造的,子树都记...

拼音分词算法 C语言

#include #define M_JUZI 200//一个树图的链表验证结构//树是由图的链式存储构造的,子树都记录了字符串typedef structst _ fenci { intleibie;//连接的是什么类别?13360终,23360初int索音;//声母后的最后一个索引或一个字中最后一个辅音后的一个字的起始索引struct ST _ FenCi * pN//兄弟} FenCitypedef struct ST _ Ci { int SuoYin//原字符串中子串(单词)索引int Chang//子串长度} Ci//structure typedef struct ST _ shengmu { charpin[3],记录结果;//首字母FenCi * pLian//分词树的子树}生木;//用于定义首字母的静态集Typedef Struct ST _慕云{ Charyin[5];//最终的字符串,不同于最初的FenCi * pLian//分词树的子树}慕云;//用于定义终结点的静态集。//声母以声母sm集合[29]开头={{"},{"b"},{"c"},{"d"},{""},{"f"},{"g"},{"h" {"r"},{"s"},{"t"},{""},{"w"},{"x"},{"y"},{"z"},{"ch"},{"sh"},{"zh"}}。//最后的结尾慕云ym jihe [24]={{"a"},{"o"},{"e"},{"i"},{"u"},{"v"},{"ai"},{"ei"},{//至于汉字的子树,可以根据《现代汉语词典》的音节表来构造。//汉字子树的构造为void initfenzishu 0(){ } int main(){ char juzi[m _ juzi];//scanf("%s ",JuZi);//算法1。初始哈希搜索,链表合取,链表合取//如果要搜索的表有限,可以使用If,else,或者哈希搜索。//要解决的问题://1.1。声母和韵母混淆,两个声母之间至少三个位置//1.2。韵母和声母的混淆,语境,韵母是否可以扩展到另一个更长的韵母,//1.3.1当你从韵母中接收到一个词,//你不仅要尝试韵母的‘扩展’,还要判断扩展后的新韵母的后缀。//如果这个后缀是声母,那么声母后面有没有合适的韵母组成新词?//如果有,就要记录下这种可能性,做好早点结束的准备。//如果没有,自然要继续‘拓展’新的总决赛。//这样的韵母如:e-er,a-an-ang,e-en-eng,i-in-ing,u-un,//这样的声母如//如果后面找不到声母列表中的所有韵母,可以扩展匹配更长的声母。//算法二。逐步找到所有的声母,分析上下文,改正,分析结构,显示//算法2.1对原文中的每个单词,逐一匹配已知的声母。//算法2.2知道声母,收集一定范围内原文中出现的每个声母点getchar();//回车返回1;}

拼音分词算法 C语言

发表评论

  • 人参与,0条评论