表示各基因所用的符号。基因的名称都尽量用缩写的字母来表示,并用斜体书写。如为显性基因,符号的第一个字母大写,如为隐性基因则小写(如 Pg和 pg)。标准(或野生)型的基因以 号表示(如 vg , vg 或 )。
同一座位如果有三种以上的等位基因时,必须在基本符号的肩上附记字母或数字以示区别(如 I O , I A , I B 等)。
相同表型的基因位于二个以上的座位时,应在基本符号和字母或数字间加一短横,或将字母或数字记在基本符号下面
(如 ert-a, ert-b; 这种情况,合子的基因型以分数表示,分别连锁在同源染色体上的基因分子和分母分开写(如: A b C/a B c),
属于二个以上连锁群的基因以另外的分数表示(如 A b C/a B c; DE/d e)。 M. Demerec等( 1966)提出的基因符号对细菌等微生物已广泛应用。
首先用 3个小写字母来表示遗传性状(如精氨酸生物合成基因用 arg;半乳糖发酵基因用 gal;紫外线损伤修复基因用 uvr来表示),
然后再附上一个大写字母以表示与该性状有关的各个基因(如 argA, argB; galE, galK等)。各基因的野生型均以 表示,而突变型则以号数来表示(如 arg A 、 arg A-1、 arg A-2等)。
因相关基因异常可能引起的疾病或导致疾病的发生概率提高.Befree数据库:Bio-Entity Finder and Relation Extraction。
BeFree利用文本挖掘技术工具来解锁包含在生物医学的文档的信息。 BeFree是一个畅通的生物医学命名实体识别(BioNER)的模块(基于使用fuzzy-模式匹配方法来查找和唯一标识实体在文献中提到的字典),它也被用于基于支持向量机(SVM)的关系抽取(RE)。
BeFree被用于从科学出版物的生物提取的关联信息的文本挖掘工作流程。简言之,文档选择之后,文本挖掘方法包括两步。第一步是生物医学出版物的实体的识别和归入BioNER模块的装置,第二步,由RE模块进行处理以识别上述的实体之间的关系。