990 likes | 1.17k Views
生物学导航站点与常用软件. 生物学导航站点与常用软件. WWW 生物资源的检索方法与重要站点介绍. 第一节. 非 WWW 生物资源的检索方法与重要站点介绍. 第二节. 第三节. 常用生物软件介绍. WWW 生物资源的查询方法. 通过搜索引擎查询. 通过主题目录. 专业指南. 搜索引擎原理. ( 1 )信息的采集和存储. 搜索引擎一般采用自动方式收集和存储信息,即运用自动运行软件,通过追寻万维网上的链接行进,找到 WEB 页并将其调出,并作上索引,形成目标摘要格式文件后再形成网络可访问的数据库。. ( 2 )信息索引的建立.
E N D
生物学导航站点与常用软件 WWW生物资源的检索方法与重要站点介绍 第一节 非WWW生物资源的检索方法与重要站点介绍 第二节 第三节 常用生物软件介绍
WWW生物资源的查询方法 通过搜索引擎查询 通过主题目录 专业指南
搜索引擎原理 (1)信息的采集和存储 搜索引擎一般采用自动方式收集和存储信息,即运用自动运行软件,通过追寻万维网上的链接行进,找到WEB页并将其调出,并作上索引,形成目标摘要格式文件后再形成网络可访问的数据库。 (2)信息索引的建立 就是创建文档信息的特征记录,使检索者能快速检索到所需信息。
搜索引擎原理 (3)检索界面的建立 搜索引擎检索界面接受检索者提交的查询请求,搜索引擎根据检索者所输入的关键词在其索引中查找,并寻找相应的WEB页地址。 (4)检索结果的相关性处理 搜索引擎的检索结果通常很庞大。搜索引擎可按照文件的相关程度进行排列,最相关的文献通常排列在最前。
搜索引擎原理 (4)检索结果的相关性处理 ------每个搜索引擎确定相关性的方法均不同。 分类或聚类法 位置法 摘要法 概率法 根据关键词在文中出现的频率来判断文件的相关性 根据关键词在文中出现的位置来判断文件的相关性,认为关键词出现的越靠前,文件的相关性就越高 搜索引擎采用分类或聚类技术,自动把查询结果归类 搜索引擎为每个文件生成一个摘要,让检索者自己判断结果的相关性
计算机检索基本原理 布尔逻辑检索(Boolean) 词组检索 计算机 检索功能 截词检索 字段检索 位置检索
计算机检索结果的显示 计算机检索结果一般以与检索词的相关性排序,并提供摘要或相关内容。 检索词的权值:检出记录中含有的检索词权值比重越大的,相关性越大(越专指的词权值越大) 检索词在数据库记录中出现的位置:检出记录中含有的检索词出现在题名字段的,比出现在其他字段的,相关性更大; 检索词所属的类目级别:检出记录中含有的检索词所属的类目级别越高的,相关性越大; 影响检索结果相关性的因素 检索词的数目:检出记录中含有的检索词个数越多,相关性越大;
搜索引擎的评价 ①搜索引擎收集的网站(或网页)数目,这会直接影响到搜索结果的广泛性; ②搜索引擎搜索结果的满意度,包括查询结果相关项命中数量、死链接和重复链接的数量等; ③搜索引擎数据库的更新频度、时效性; ④搜索引擎提供的查询功能使用的便利性,如除了支持简单搜索外,是否还支持逻辑查询和多词查询,多词查询是自动分词还是须加标记,是否能自动识别中英文; ⑤对于目录分类式搜索引擎,目录分类的合理性,分类的广度和深度,以及在类别中的内搜索能力也是衡量该搜索引擎性能的一个重要标准; ⑥对于中文搜索引擎还要看它能否自动识别中英文,能否自动进行内码转换,如国标码(GB)与大五码(Big5)的相互转换。
检索过程 • 文献检索应该是一个重复(或说是螺旋)的过程,而不应该是一个线性的过程;在这一过程中,你要对结果进行精炼。当你检查检索结果的时候,在全面性(能够得到的信息数量)和精确性(你需要的有用信息数量)之间达成平衡是非常重要的。
检索过程 检索过程可以分解成以下几个步骤 将检索问题分解成几个相关概念 寻找检索相关术语 考虑可供选择的同义词 检索词组配 检查和精炼 检索问题焦点化
常用搜索引擎介绍 • 外文常用搜索引擎 • 中文常用搜索引擎
生物专业搜索引擎 • Scirus是目前互联网上最全面、综合性最强的科技文献门户网站之一,由Elsevier科学出版社开发。 • Scirus覆盖的学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。
Internet Public Library • 提供生命科学等学科的主题目录及搜索引擎 • http://www.ipl.org/
http://infomine.ucr.edu/ • 提供多学科的专业搜索引擎 • 美国加州大学维护
虚拟图书馆www virtual library • http://vlib.org/Overview.html • 是较早存在于因特网的导航工具,每个专题都是由该领域的知名人士或研究院所承担维护工作。交叉学科之间有相互指引。
哈佛大学分子细胞学系导航站点 • 主要提供生化分子生物学及其数据库、免疫、进化、在线生物期刊、斑马鱼研究和生物相关工作联系。
CMS MBR生物网站 http://restools.sdsc.edu/ • 该网站是美国加州大学1996年创办的生物学网站,内容包括蛋白质分析和生物化学,DNA分析和分子生物学,生物分子模型,生物信息科学和计算机的生物学,生物科学研究及生物技术。
Biology on Line 生物学在线 • 提供生物学在线词典、生物学教学和生物学网页的相关链接。
Bio online http://www.bio.com/ • 为生物科学和相关工业提供适时信息,提供最新消息、试验原理方法等。 • Bio.com is the successor to BRNI, an Internet project initiated in early 1992. At that time, the Internet was used solely for research purposes and I had no preconception that its use would become as wide-spread and general as it is today. In retrospect, it's difficult for even me to recall that we were one of only 50 websites that existed worldwide in 1992. We've watched the rise and fall of the "dot.com" boom and have proudly remained true to our cause through it all. It has been a challenge for us to grow and adapt to the rapidly changing Internet environment, and it often seems that our long-range plans change weekly. Consequently, Bio.com continues to be a work in progress-with dynamic goals and dimensions. Please utilize and judge Bio.com accordingly.
Bio-Web http://cellbiol.com/ • 提供细胞和分子生物学家网上生物学信息,包括字典、序列工具、生物邮件、新闻组、软件下载及其一些重要网络站点的链接。
Cell and Molecular Biology on line • http://www.cellbio.com/ • 提供分子及细胞生物学相关信息,包括研究、教育、通讯、展望4个板块,是Pamela M. Gannon的个人网站。
Amos' WWW links page • http://us.expasy.org/alinks.html • 一个非常好的个人主页,维护者Amos Bairoch将网上生物资源分成40几类。目前超过1000个链接。
中国医学生物信息网http://cmbi.bjmu.edu.cn/ • 提供大量生物医学新闻、文献、专题及教学资料。并提供基因导航、心血管导航、医学导航,以及专业搜索引擎等。是一个优秀的生物学网站。 • 是“211”数据库之一
国家数字图书馆生命学科门户网站 • http://202.127.20.12:10000/ • 由中国科学院上海生命科学研究院、上海图书馆上海科技情报研究所、 生命科学图书馆 共同维护。生命科学学科信息门户是一个综合性生命科学信息资源和信息服务的门户网站,其收集范围是任何与生命科学(含生物学)有关的因特网资源,主要面向科研、兼顾教育以及其他用户对生命科学资源的需求。
中国科学数据库 www.sdb.ac.cn • 其中包含众多国内外生物数据库的链接,由8个大类组成。 • 科学数据库的内容涵盖了化学、生物、天文、材料、腐蚀、光学机械、自然资源、能源、生态环境、湖泊、湿地、冰川、大气、古气候、动物、水生生物、遥感等多种学科,由中国科学院各学科领域几十个研究所的科研人员参加建设。截止“九五”末期,科学数据库专业数据库已达到180个,总数据量达7250亿字节(725GB)。科学数据库基于中国科技网对国内外用户提供服务,在中国科技网上已建立了集中与分布的Web站点19个,上网专业数据库153个,数据量约3250亿字节(325GB)。
北大生物信息中心http://www.cbi.pku.edu.cn • 北京大学生物信息中心(CBI)成立于1997年,是欧洲分子生物学网络组织EMBnet的中国国家节点。目前是国内数据库种类最多,数据量最大的生物信息站点, 为国内外用户提供了多项生物信息服务。
中国生物信息网 • 生物信息中心的服务功能: • 建立我国基于网络的生物信息服务平台,为研究人员和管理人员提供服务。这一生物信息服务平台的建设与发展将坚持以“保护产权、加强交流、便于合作、促进研究”为宗旨,同时也为国家对生物信息的统一管理提供有效的手段。 • BioSino 服务平台由以下三部分组成: • BioSino Database • BioSino Laboratory • BioSino Navigator
生物学相关的非www资源 FTP资源 FTP客户程序是在用户本地主机上运行的应用程序,其基本功能是实现远程登陆,连接用户主机与远程FTP服务器,对本地主机和远程FTP服务器的文件和目录进行管理及传输文件。
北大天网FTP、WWW文件搜索引擎http://bingle.pku.edu.cn/北大天网FTP、WWW文件搜索引擎http://bingle.pku.edu.cn/ 搜索方法 1、 简单搜索 2 、按类别搜索文件 3、 使用快捷方式