1 / 14

Автоматическая обработка естественного языка

Автоматическая обработка естественного языка. I. Обработка письменного текста. XML — язык разметки (лингвистических) данных. а также XSL — язык для преобразования данных. Что такое XML?. В Интернете всё написано! http://w3schools.com http://en.wikipedia.org/wiki/Xml

gaenor
Download Presentation

Автоматическая обработка естественного языка

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Автоматическая обработка естественного языка I. Обработка письменного текста

  2. XML — язык разметки (лингвистических) данных а также XSL — язык для преобразования данных

  3. Что такое XML? В Интернете всё написано! • http://w3schools.com • http://en.wikipedia.org/wiki/Xml • http://www.w3.org/XML/ • …

  4. Что такое XML? • eXtensible Markup Language • Extensible — расширяемый.Каждый пользователь приспосабливает его для своей задачи. • XML внешне похож на HTML. • Это тоже язык разметки. (HyperText Markup Language) • Синтаксис обоих происходит от SGML (Standard Generalized Markup Language)

  5. Пример HTML <html> <head> <title>Title of page</title> </head> <body> <p>This is my first homepage.<br> <b>This text is bold</b> </p> </body> </html>

  6. ...Вот что из этого получается: 1page.htm

  7. Пример XML <?xml version="1.0" encoding="ISO-8859-1"?> <CHESSBOARD> <WHITEPIECES> <KING><POSITION COLUMN="G" ROW="1"/></KING> <BISHOP><POSITION COLUMN="D" ROW="6"/></BISHOP> <ROOK><POSITION COLUMN="E" ROW="1"/></ROOK> <PAWN><POSITION COLUMN="A" ROW="4"/></PAWN> <PAWN><POSITION COLUMN="B" ROW="3"/></PAWN> … </WHITEPIECES> <BLACKPIECES> <KING><POSITION COLUMN="B" ROW="6"/></KING> <QUEEN><POSITION COLUMN="A" ROW="7"/></QUEEN> <PAWN><POSITION COLUMN="A" ROW="5"/></PAWN> <PAWN><POSITION COLUMN="D" ROW="4"/></PAWN> </BLACKPIECES> </CHESSBOARD>

  8. ...Вот что он описывает:

  9. Чем XML отличается от HTML? Почти всем. • Главное — назначением • HTML используется для отображения данных в браузере. В нем смешаны элементы содержания и оформления. • XML используется для хранения данных и описания их структуры. Он задаёт только содержание документа.

  10. Чем XML отличается от HTML? • Гибкостью • Тэги HTML и их значение жёстко заданы в спецификации. • В спецификации XML фиксирован только синтаксис. Тэги XML и их значение задаются пользователем. • Фактически, XML — это не один язык, а семейство языков, потому что каждый пользователь, придумывая свои тэги, задаёт свой язык.

  11. Чем XML отличается от HTML? • Немного — синтаксисом (см. далее) • Основные понятия: • документ (≈ файл) • элемент <KING><POSITION COLUMN="G" ROW="1"/></KING> • атрибут COLUMN="G"

  12. Синтаксис XML • Каждый документ должен иметь ровно один корневой элемент • У каждого открывающего тэга должен быть закрывающий • Тэги должны быть правильно вложены друг в друга • Значения атрибутов обязательно берутся в кавычки • Регистр символов в именах важен!

  13. Преобразования XML-данных

  14. Продолжение — на w3schools.com (и не только) • Примеры использования XML в жизни • Тест на основные понятияhttp://w3schools.com/xml/xml_quiz.asp • Учебники по XML и другим технологиям (XPath, XSLT и др.) а также • Зачем нужен XML лингвистам?

More Related