1.98k likes | 2.09k Views
网络信息资源 的特点及其利用 黄晓斌 中山大学资讯管理系 2009 年 11 月 21 日. 拟介绍的问题. 网络信息资源定义 网络信息资源的类型 网络信息资源的特点 网络信息资源的结构 网络信息资源利用的内涵 网络信息资源利用的方式 网络信息资源利用的策略. 网络信息资源其他称谓. 网络信息资源尚没有统一的定义 类似的名称很多 , 如: “因特网信息资源” “电子信息资源” “联机信息” “万维网资源” “数字信息资源”. 网络信息资源定义. 网络信息资源可以理解为通过计算机网络可以利用的各种信息资源的总和。
E N D
网络信息资源 的特点及其利用 黄晓斌 中山大学资讯管理系 2009年11月21日
拟介绍的问题 • 网络信息资源定义 • 网络信息资源的类型 • 网络信息资源的特点 • 网络信息资源的结构 • 网络信息资源利用的内涵 • 网络信息资源利用的方式 • 网络信息资源利用的策略
网络信息资源其他称谓 • 网络信息资源尚没有统一的定义 • 类似的名称很多,如: • “因特网信息资源” • “电子信息资源” • “联机信息” • “万维网资源” • “数字信息资源”
网络信息资源定义 • 网络信息资源可以理解为通过计算机网络可以利用的各种信息资源的总和。 • 网络信息资源是从计算机技术、通信技术、多媒体技术相互融合而形成的网络上可查找的资源。
网络信息资源类型 • 从内容上网络信息资源几乎涵盖了人类所有的重要活动 • 对网络信息资源进行了类型化和体系化研究,产生了不同的分类方案 • 目的是便于更好地认识、组织、检索、管理和利用。
网络信息资源的划分——按应用工具方式分 • 电子邮件 • 用户组 • 远程登录 • 文件传输 • WWW • Gopher • WAIS
网络应用的新形式 Web2.0 • 博客(BLOG) • 播客 (PODCASTING) • 书签(Tag) • 真正简易聚合(RSS) • 即时通讯(Instant Messenger,简称IM),典型代表为MSN和QQ。 • 社会性网络软件(Social Network Software,简称SNS) • WIKI(维基)
网络信息资源的划分——按信息交流的方式 • 非正式出版信息。 • 如电子邮件、专题讨论小组和论坛电子会议、电子布告板新闻等。 • 半非正式出版物。 • 从各种单位的网址或主页上, 可以查询正式出版物系统所无法得到的“灰色”信息。 • 正式出版物。 • 各种数据库联机杂志和电子杂志、电子版工具书、报纸、专利信息等。 • 因特网将多类型和多层次的信息是融为一体。
网络信息资源的划分——按网络信息资源的层次分网络信息资源的划分——按网络信息资源的层次分 • 指示信息 • 即一个信息单元的地址。 • 信息单元 • 可以指示信息表达的最小信息单元。 • 信息集合 • 指相互关联的信息集合。是由若干相关信息及其中特定的信息单元和指示信息所组成的。 • 信息系统 • 指一组相关的、经过标引和建立了交互参见的信息资源的集合。
网络信息资源的划分——按信息资源的来源 • 政府 • 研究机构 • 事业单位 • 公司企业 • 社会团体 • 个人
网络信息资源的划分——按信息资源的内容主题网络信息资源的划分——按信息资源的内容主题 • 政治性文件 • 学术研究报告 • 经济活动的信息 (广告、企业情况 ) • 历史文献资料 • 教育 • 公共性(社区信息) • 娱乐性
网络信息资源的划分—从网络信息载体分 • 文本 • 图像 • 图形 • 动画 • 声音 • 视频 • 组合媒体
虚拟现实技术 • 虚拟现实VR(Virtual Reality )技术是利用计算机生成一种模拟环境 • 通过多种专用设备使用户“投入”到该环境中 • 实现用户与该环境直接进行自然交互的一门崭新的综合性信息技术。
虚拟现实技术的特点 • 多感知性(Multi-Sensory) • 临场感(Immersion) • 交互性(Interactivity) • 构想性(Imagination)
一些虚拟现实的设备 〓 头戴式显示器〓 〓 数据手套〓 〓 轨迹球 〓
VRML • VRML(Virtual Reality Modeling language即虚拟现实建模语言) • 在WWW上建立3D虚拟空间的工具 • 它使WWW的页面不再局限于二维空间,使网上的三维世界动了起来。 • VRML浏览器可以浏览Web上的三维实境。
VRML 的应用 • 教学 • 培训 • 广告 • 科研 • 军事 • 娱乐 • 其他
网络信息资源的特点 • 数量巨大 • 类型多样 • 变化频繁 • 结构复杂 • 传播快捷 • 共享性好 • 质量不一
数量巨大 • 网络信息量大,内容丰富。 • 网络信息增长较快。 • 随着计算机硬件、软件技术的不断发展,特别是海量存储等技术为大容量、高速度的网络服务器提供了条件; • 计算机的信息处理能力不断增强,许多形式的信息都可以在网络中存储和传递。 • 可以肯定网络信息资源将进一步激增
HOW MUCH INFORMATION in Internet in 2003? The size of the Internet in terabytes. Medium 2002 Terabytes • Surface Web 167 • Deep Web 91,850 • Email (originals) 440,606 • Instant messaging 274 • TOTAL 532,897 Source: How much information 2003
2009年中国互联网络信息资源数量调查 • 从2008 年底到2009 年6 月,中国的IPv4 地址数量半年增长2,375 万个 • 截至2009 年6 月,中国域名的总数为1,626 万个,其中CN 域名1,296 万个。 • 中国网站数量为306.1 万个,其中CN 下网站数占78.7%。 • 中国国际出口带宽为747,541.4Mbps,半年增长16.8%。 资料来源: 中国互联网络信息中心《第24次中国互联网络发展状况统计报告》
类型多样 • 内容包罗万象,覆盖了不同学科、不同领域、不同地域、不同语言的信息资源。 • 不仅有题录、摘要,而且还有不少全文。 • 载体包括文本、图像、声音等。 • 多媒体、多语种、多类型信息的混合体。 • 形式上既有公开出版、又有非公开发行的包括会议文献、学位论文、内部资料
变化频繁 • 网络信息资源是一个动态系统。 • 网络信息更新迅速,网页增加、删除、更换地址经常发生。 • 网络信息的资源时效性强。 • 网页更新周期缩短,有关的内容处于一种动态的变化之中。 • 在网上能得到最新的资料以及某个学科或某项科研的最新动态,能检索到最近出版的文献。
结构复杂 • 网络信息分别存储在不同国家、不同地区的服务器上。 • 对信息资源的组织管理没有统一标准,百花齐放 • 不同的服务器采用不同的操作系统及数据结构 • 从整体上来看,基本处在无序的状态。 • 不少的服务器还用中间件与其他数据库连接起来 • 在管理和利用方面比较复杂。 • 结构化数据 半结构化数据 非结构化数据
质量参差 • 网上信息发布具有很大的自由度和随意性 • 缺乏必要的过滤、质量控制和管理机制。 • 网络信息具有不同的层次与效用 • 既有科学前沿研究报告,也有大众通俗读物;既有已经加工整理的信息,也有无序的原始信息;既有较大参考价值的信息,也可能混有毫无用处的“信息垃圾”,甚至还有不少有害的信息。 • 良莠不齐 • 有的可以带来极大的效益,有的可能会造成不良后果,利用的价值差异较大
网络信息污染 • 信息污染是指信息资源中混入了一些干扰性、欺骗性、有害信息的现象 • 影响了人们对有用信息的利用, 甚至造成对人类的危害。 • 网络环境下信息污染主要是指网络信息对用户造成不良的后果,或对正常的信息利用带来负面的影响。
网络信息污染的形式 • 冗余信息 • 失效信息 • 污秽信息 • 网络病毒 • 虚假信息 • 信息文化侵蚀
用户差异大 • 网络用户类别多样; • 用户群体也表现出多样性的特点; • 各种用户之间的需求类型差异很大; • 用户信息需求变化频率加快; • 用户需求日趋向个性化、特殊化 • 部分用户需求更加趋向专门性。
中国网民规模 • 截至2009年6月30日,中国网民规模达到3.38亿人,普及率达到25.5%。 • 宽带网民规模达到3.2亿人,占网民总体的94.3%。 • 中国手机网民规模为1.55亿人,占整体网民的45.9% • 我国网民规模、宽带网民数、国家顶级域名注册量三项指标仍然稳居世界第一 • 中国互联网络信息中心(CNNIC)《第24次中国互联网络发展状况统计报告》
传播快捷 • 互联网对社会热点事件的反应速度之快是前所未有的 • 网络越来越多地主导了舆论的方向。 • 网民们也乐于在互联网上发表自己对当前社会热点事件的见解。 • 几乎每一个社会热点出现,就会导致一个网络流行语的产生。
为什么“做俯卧撑”很快火了起来 • “三个俯卧撑”之所以成为热点,贵州省省公安厅对“瓮安6.28严重打砸抢烧突发性事件新闻发布会”上的说明。 • 其中在说明“关于李树芬溺水死亡事件的事实”时,有这样的描述:“刘见李树芬心情平静下来,便开始在桥上做俯卧撑。当刘做到第三个俯卧撑的时候,听到李树芬大声说‘我走了’,便跳下河中……” • 很快,描述的这一细节中的三个俯卧撑就成为互联网上网民关注的热点,在网民恶搞之下,“三个俯卧撑”很快火了起来。
满网尽是俯卧撑 1. 给我做三下俯卧撑,我也能推动地球。——阿基米得 2.如果我曾经看得远一点,是因为我比别人多做了三下俯卧撑。——牛顿 3. 做俯卧撑时运动速度大小,取决于你选取的参照物。——爱因斯坦 4. 天才就是百分之九十九的汗水加上三个俯卧撑。——爱迪生 5.俯卧撑即合理。——黑格尔 6.做俯卧撑还是立卧撑,这是个问题。——哈姆雷特 7.俯卧撑尚未完成,同志们仍需努力。——孙中山 8.我撑故我在。——笛卡尔 9.俯卧撑已经做三下了,胜利还会远吗?——雪莱 10.世界上本来是没有路的,做俯卧撑的人多了,也就成了路。——鲁迅 11.做自己的俯卧撑,让别人说去吧!——但丁
网络信息资源的结构 • 网络信息资源 来源广泛、结构多元、分布复杂 • 网络信息资源的结构可以分为: • 内容结构、表述结构、组织结构、分布结构和传播结构。
网络信息资源的分布 • 地域分布 • 时间分布 • 行业分布 • 内容分布
我国网络资源的地域分布 全国域名数约为 259.2万个,广东(16.8%)、北京(13.8%)、福建(9.5%)位列全国前三名。 全国CN域名数约为 109.7万个,北京(17.8%)、广东(15.6%)、福建(9.7%)位列全国前三名。 全国网站数约为69.4万个, 北京(18.6%)、广东(16.6%)和浙江(9.7%)位列全国前三位。 • 全国网页总数约为24亿个,北京、上海、广东和浙江是拥有网页数量和网页总字节数最多的四个省市。