甘蔗糖业  2011 Issue (2): 5-9   PDF    
用MS Access数据库分析甘蔗品种血缘
李金玉1, 张琼1, 邓海华2     
广州甘蔗糖业研究所, 广东省甘蔗改良与生物炼制重点实验室, 广东, 广州, 510316
摘要:以Microsoft Access数据库为平台,设计并制作了一个数据库系统.该系统可以展示并打印2000多个甘蔗品种(系)的树型系谱图,并分析这些品种(系)历代祖先的血缘含量.该系统可作为甘蔗育种工作者在进行亲本选配工作时的辅助工具.
关键词甘蔗     育种     系谱图     血缘    
Application of MS Access to Anylize the Blood Information of Sugarcane Clones
LI Jin-yu1, ZHANG Qiong1, DENG Hai-hua2     
Guangzhou Sugarcane Industry Research Institute, Guangdong Key Lab of Sugarcane Improvement&Biorefinery, Guangzhou, 510316
Abstract: Taking Microsoft Access as a platform,a database was developed to analyze the blood information of over 2000 sugarcane clones.It can show or print a tree-shaped diagram,which reveals the relationships among a clone's whole ancestry set.It can also show the blood contents a clone inherited from its respective predecessors.This database is designed to be a tool helpful to those engaged in parental selection work.
Key words: Sugarcane     Breeding     Tree     Blood    

1994 年,李金玉等用dBase III Plus 开发了一 个程序。利用该程序,用户可在电脑显示屏上显示 1000 多个甘蔗品种(系)的系谱图[1]。这是电子计 算机在甘蔗育种上的早期应用之一。李奇伟等 (1997)建立了甘蔗品种资源信息管理系统,并对 我国主要品种与其原始亲本亲缘关系及亲缘关系与 品种种性的关系进行了分析[2]

时至今日,电子计算机的应用越来越广泛。越 来越多的甘蔗育种工作者已经开始使用电子计算机 作为辅助工具来进行数据分析、统计等工作。越来 越多的育种工作者希望利用计算机协助进行亲本选 配和血缘分析。在其它作物如水稻上,已经有人开 发了品种血缘分析与血缘系谱图软件。因此,开发 一个甘蔗品种血缘与系谱分析工具很有意义。

基于这个目的,本文作者用MS Access 为平 台,开发了一个简单、实用的甘蔗品种血缘分析与 系谱图软件。该软件可以显示并打印2000 多个甘 蔗品种(系)的系谱图,并分析它们的血缘组成, 希望能够给甘蔗育种工作者在进行亲本选配时提供 有益的信息与帮助。

1 运行环境

本系统用MS Access 数据库编写,其运行环境 与MS Access 的运行环境完全一致。一般来说,安 装有Microsoft Windows 98 及更高版本的操作系 统,安装并能正常使用MS Office 97 或更高版本的 Office 版本(必须包括MS Access 和MS Word 这2 个组件)、显示器分辩率在1024×768 以上的电脑 都可使用本系统。

2 工作原理与系统构思
2.1 树型系谱图

通常来说,每一甘蔗品种都有1 个母本和1 个 父本(多父杂交或辐射育种等特殊方法育成的品种 除外)。同样,这些母本或父本也都有各自的母本 和父本。如果自某一品种开始,将它的各代祖先一 代一代追朔下去,一直追朔到基础种质或不能追朔 为止,并将这些祖先用某种方式排列起来,用线条 来勾勒它们之间的关系,便得到了该品种的系谱 图。品种系谱图为一种多分枝树型图。

系谱图的排列方式常见的有2 种:一种是子代 在上排列,即将子代排在第1 行,父代排在第2 行, 祖代排在第3 行,曾祖代排在第4 行,依此类推。 另一种则与上一种方法恰恰相反,是子代在下排 列,即“辈分”越高则排列的位置越高。这2 种方 法对于描述小型系谱图是合适的。不过,如果亲系 超过5 代,则很容易导至系谱图宽度过大而无法全 部排列。

本系统采用排列方式不同于上述2 种方式,用 的是子代在左排列方式,即目标品种排在第1 列, 其父代排在第2 列,祖代排在第3 列,曾祖代排在 第4 列,依此类推。因此,“辈分”越高则排列的 位置越靠右(见图1)。

图1 甘蔗品种树型系谱图图样

在图1 中,目标品种POJ2818 被排在第01 列, 而该品种的2 个父代POJ2364 和EK28 便排在第02 列,而POJ2364 和EK28 的父代便排到了第03 列, 等等。

每一个祖先排一行。至于各祖先排在哪一行则 是依照“母本优先”原则来排列,即,对于每一分 枝,其母本(包括所引领的树分枝)始终排列在对 应父本的上面。

最后,用线条连接各子代与对应的母本与父本 便形成了本系统采用的甘蔗品种树型系谱图。

2.2 完全树与简略树

很多时候,同一祖先在树型系谱图中会出现不 止一次。如图1,POJ100 在POJ2878 的系谱图中, 首先作为其母本POJ2364 的母本出现,后来又作为 其父本EK28 的父本再次出现。相同的血缘可能来 源于不同的树分枝。

用不同的方式处理重复出现的树分枝便得到了 2 种不同的系谱树。一种是完全树,该系谱树将重 复出现的树分枝原样重复示出,以展示系谱图真实 原貌,如图1 左图所示;另一种是简略树,重复出 现的树分枝不再重复示出,仅标出该枝在整树中所 在的位置。如图1 右图所示的简略树,POJ100 在 第3 行为作POJ2364 的母本首次出现时,其所带的 系谱树分枝将会全部列出,但在第13 行,作为EK28 的父本再次出现时,则仅显示“见第3 行”,将用 户引向该分枝所在行,而不再重复显示POJ100 的 树分枝。

一般来说,完全树更适合于浏览,这样可以更 清晰、直观地展现品种血缘系统树的全貌。完全树 有时会比较长,如果原样打印出来会造成很大的纸 墨浪费,因此,打印时以简略树更为合适。

2.3 血缘含量

品种(系)的各代祖先对该品种的血缘贡献是 不同的。理论上来说,每一品种可从该品种的2 个 父代中各获取50%的血缘,可从该品种的4 个祖 代中各获取25%的血缘,依此类推。根据这个原 理,本系统自动计算目标品种各代祖先对该品种的 血缘贡献。如果某祖先在血缘树中出现多次,则将 该祖先的血缘贡献进行累加,最后显示汇总结果(见 图2,该图以桂糖11 号为例)。

图2 血缘含量显示结果图样(以桂糖11 号为例)
3 系统构件与作用

本系统采用MS Access 编写。主要部件如下:

⑴数据表Parentage。该数据表有3 个字段: Name、Mother、Father,分别代表品种名以及该品 种的母本和父本。该数据表记录了2000 多个甘蔗 品种(系)的父母本资料,是本系统的关键数据。 本系统运行时,将在该表中进行递归查询,直到将 目标品种的所有各代祖先全部查找完毕为止。

⑵数据表Ancestor。该数据表也有3 个字段: Serial、Name、GenNum。系统运行时,会自动在 该数据表中记录目标品种的各代祖先以及这些祖先 在系统树中所处的位置,即行号与上朔代数。由于 该上朔代数反映了该祖先的“辈分”,所以,本系 统可根据这个数据计算出该祖先对目标品种血缘的 贡献。

⑶系统树呈示窗体。这是本系统的主要显示与 操作界面(见图3)。后文将详细叙述该窗体的各 个组成部分与作用。

图3 系统主要操作界面缩略图

⑷血缘含量子窗体。这个子窗体镶嵌在系统树 呈示窗体中,用于显示各祖先的血缘含量。用户可 根据需要自行决定是否显示该子窗体。该子窗体可 根据Ancestor 数据表中所记录的数据采用汇总查询 方式计算并显示品种各代祖先的血缘贡献,并按大 小排列。

⑸Parent 程序模块。该程序模块有1 个可以公 共访问的函数过程。该函数可传入2 个参数,第1 个参数是品种名,代表目标品种,第2 个参数为可 选参数,该参数决定生成的系统树为完全树还是简 略树,如果省略该参数则默认为生成完全树。该函 数以多行字符串形式返回传入参数品种的树型系谱 图。

该程序模块中另有一个简短、高效的私有函数 过程,它仅能被Parent 程序模块中的函数或过程所 调用。该函数采用递归调用(即自己调用自己)方 式搜寻目标品种的全部各代祖先,生成树型系谱 图,并在数据表Ancestor 中记录各祖先的位置信 息。该函数为本系统的核心程序。

4 操作方法与使用说明

以下我们将以“桂糖11 号”为例说明如何使 用本系统。

打开本系统,品种下拉列表框中选择“桂糖11 号”,再单击“完全树”单选框去掉该单选框前面 的勾,系统显示结果见图3。这就是“桂糖11 号” 的血缘系谱树及血缘组成表。

这是本系统的主要操作界面。操作界面可分为 3 个区:控制区、亲系树浏览区和血缘含量显示区。

4.1 控制区

控制区在窗体的右下角(见图4)。在控制区, 有1 个下拉列表框,用户可在这里选择目标品种(或 直接输入品种名)。有2 个单选框:“完全树”单选 框可让用选择显示完全树还是简略树;“含量表” 单选框可让用户显示或隐藏血缘含量显示区。用户 的各种选择都会在亲系树浏览区和血缘含量显示区 立刻反映出来,几乎没有时间延迟。有2 个命令按 钮,单击“结束” 按钮则会关闭窗体,结束程序 的运行。

图4 系统控制区
4.2 亲系树浏览区

亲系树显示在窗体的左上角,占据窗体的大部 分(见图1)。这是一个可以滚动显示的文本框, 如果系谱图超长,可以用光标控制键来滚动显示其 余部分,或上、下浏览全树;如果系谱图超宽,则 可将血缘含量表隐去,以显示系谱图超宽部分。

亲系树浏览区最左测有2 列数字,第1 列为行 号,第2 列为该行中的祖先的在系谱树中所处的列 数再减1,代表着该行的祖先为目标品种的第几代 祖先(处于第2 列的祖先为目标品种的上朔第1 代 祖先,依此类推)。

在亲系树显示区的最上面和最下面各有一个列 号标尺,用这2 个标尺也可以直观地显示出各树分 枝的“辈分”。

4.3 血缘含量显示区

该区在窗体的右上角(见图2)。在该区以列 表方式显示出目标品种各代祖先血缘在目标品种中 的含量,并按血缘含量大小排列。如果祖先数量较 多,则可滚动显示。该区可根据需要由用户决定是 否显示。

4.4 打印系谱图

在控制区单击“打印” 按钮可以打印或保存 品种的系谱图。

为了给用户最大的方便,本系统的提供的打印 功能实际上是将品种的树型系谱图连同行号与列号 直接生成为一个规定格式的、可打印、可修改的MS Word 文档(见图5)。用户可自行决定是否打印、 存档、修改或调整格式后再打印。

图5 输出成MS Word 文档后的系谱图(局部)
5 讨论

⑴本系统运行速度较快,界面直观,操作简单。 甘蔗育种工作者可利用本系统随时查看各品种或亲 本的系谱图,或查看各品种或亲本的血缘组成,或 将重要品种(亲本)的系谱图打印存档,为选择甘 蔗亲本提供决策参考。

⑵本系统对甘蔗育种工作者的参考价值大小几 乎完全取决于Parentage 数据表中数据的准确性与 完整性,因此,本系统仍会在将来的使用过程中逐 步完善,充实该数据表的内容,修正数据表中可能 出现的错误,为甘蔗育种工作者提供快捷、准确的 甘蔗品种系谱信息。

⑶本系统具备很强的可移植性。只要将基础数 据表Parentage 换成其它作物的品种亲系数据,则 本系统就可不作任何其它改动而适用于该种作物品 种(系)的血缘分析。

不过,本系统的功能目前仍很有限。有很多育 种工作者所感兴趣的功能仍在开发之中,这些功能 将在本系统的后续版本中陆续加入补充。

参考文献
[1]李金玉,龚恒亮.用电子计算机分析甘蔗品种血缘[G]//中国大陆甘蔗育种四十周年学术讨论会甘蔗品种选育技术论文选,广州:轻工业部甘蔗糖业研所,1994:102-106. (1)
[2]李奇伟,邓海华,周耀辉.亲缘系数及其与品种种性的关系[J]. 甘蔗,1997(4):1-5. (1)
(本篇责任编校:邢海萍)