130 likes | 266 Views
基于内容的电影搜索引擎. 第六组 admin@movie.cnkk.org 谢莹、朱传聪、胡吉柱、肖骁、张深毅、黄进东. 主要内容. 现实意义 系统设计 网页的采集与处理 分类组织电影预告 人机交互界面 提醒服务 其它功能 运营与盈利 总结. 简介. 实现对武汉搜索影院电影预告和相关电影影评的搜索 按照内容分类组织电影预告,建立统一的电影预告表 实现基于电影内容的预告和影评搜索,并提供提醒服务 为该搜索引擎设计一种以上的运营模式. 现实意义. 搜索引擎的核心价值 让人们最便捷地获取信息,找到所求 首先 , 有意义 , 需求分析
E N D
基于内容的电影搜索引擎 第六组 admin@movie.cnkk.org 谢莹、朱传聪、胡吉柱、肖骁、张深毅、黄进东 http://movie.cnkk.org
主要内容 • 现实意义 • 系统设计 • 网页的采集与处理 • 分类组织电影预告 • 人机交互界面 • 提醒服务 • 其它功能 • 运营与盈利 • 总结 http://movie.cnkk.org
简介 • 实现对武汉搜索影院电影预告和相关电影影评的搜索 • 按照内容分类组织电影预告,建立统一的电影预告表 • 实现基于电影内容的预告和影评搜索,并提供提醒服务 • 为该搜索引擎设计一种以上的运营模式 http://movie.cnkk.org
现实意义 • 搜索引擎的核心价值 • 让人们最便捷地获取信息,找到所求 • 首先,有意义,需求分析 • 虽然现在很容易下载,但是… • 其次,可行,可行性分析 • 技术可行性 • 最后,收益 • 一切为了利益 http://movie.cnkk.org
SGML Parser URL列表 系统设计 影讯 分类 查询结果 用户 查询 分词 SQL Cron 登录 设置提醒 用户 提醒 提醒服务 短信 Email http://movie.cnkk.org
网页的采集与处理 • 手工加入电影院网址列表 • wget下载整站或局部 • 使用python的SGMLParser解析html • 存入数据库 • 为什么用Python • GML->SGML->HTML->XML • SGML Parser http://movie.cnkk.org
分类组织电影预告 • 数据挖掘 • 关键字匹配 • 关键字向量? • … http://movie.cnkk.org
人机交互界面 • 目标: 友好的用户界面,美好的用户体验 • JDBC+Struts(*)+JSP+AJAX • 速度: • 数据库连接池 • 负载均衡 • 界面: • JSP • jQuery Tomcat A Tomcat A Tomcat A http://movie.cnkk.org Tomcat A Tomcat A http://movie.cnkk.org
提醒服务 • 手机短信提醒 • 输入手机号 • 回复短信确认 • 系统在用户指定的时间发送短信提醒 • 邮件提醒 • 设置email地址 • 系统在用户指定的时间发送email提醒 • 程序实现 • Linux的cron服务实现定时 • 飞信类库发送短信 • python程序发送邮件 http://movie.cnkk.org
其它功能 • 在线地图 • 查找附近超市 • 手机访问+手机公交查询软件 • 工具软件下载 • 组团 • 一起看电影 http://movie.cnkk.org
开发环境和语言 • 操作系统: • Ubuntu 8.04 • 网站服务器: • Apache Tomcat 6.0.16 • 数据库: • MySQL5.0.5 • 程序设计语言: • Python2.5.2 • Bash脚本 • JSP 2.1 • jQuery 1.2.6 http://movie.cnkk.org
运营与盈利 • 影院竞价排名??? • 广告 • 电影院 • 电影院附近超市 • 与交友网站合作 • 影友,一起看电影 • 引领时代潮流!!! http://movie.cnkk.org
Thanks • http://movie.cnkk.org • admin@movie.cnkk.org • svn://movie.cnkk.org/movie/ • 谢莹,朱传聪,胡吉柱,肖骁,张深毅,黄进东 http://movie.cnkk.org