计算机程序设计

解析:它是什么,它是如何产生

很多时候,在互联网上,你可能会遇到的一个术语,如“解析”。 它是什么和为什么你需要? 恰巧,程序员给工作梁任何部位。 还是普通用户面临这样的术语不知道它的价值。

定义

如果我们把一般意义上,解析 - 当特定语言的线性规则,它可以是任何人,在通信中使用的比较的字序列。 它也可以形式化的语言,如编程语言。

而对于网站在回答关于解析的问题 - “是什么”,“为什么要用” - 可以说,这是可在网页上的信息连续解析的过程。 这里的文字是一组被分级排序,并通过计算机与人类语言的手段的结构化数据。 后者提供直接的信息,里面的人而来。 和编程语言指定如何显示在用户的显示器上该数据。

内容搜索

当主人只创建了自己的网站,他面临着一个问题:在哪里得到的内容来填充? 最好的办法是寻找广域网。 毕竟,有无穷多的知识。 但后来有一些困难:

  • 由于互联网在不断成长和发展,很显然,该网站应包含以具有在竞争中占据优势的海量信息。 今天,内容必须是非常多。 在手工填写尽可能多的网站的信息是非常困难的。
  • 由于人们无法满足日新月异的信息层出不穷的需求分析。 会是什么给? 自动化信息收集和处理的变化。

利弊解析

执行解析过程中,在与一个人比较一个程序具有许多优点:

  • 她很快就通过成千上万的网页行走。
  • 没问题,将共享技术数据和信息传递给正确的人。
  • 如果没有错误丢弃多余的,只留下什么是必要的。
  • 生产包装必要的数据为用户视图。

当然,最终的结果仍需要一些治疗。 这不要紧, 电子表格 或数据库。 但是,这是不是你做手工,而不是使用解析容易得多。 它是什么,它是明确的 - 节省时间和精力。

设计

各种用于创建解析器的编程语言。 最常见的是脚本语言。 这意味着它们都写在剧本。 什么是脚本,什么是解析使用这样的语言将在以后考虑进行。

程序分析器的创建不需要编程语言的知识显著。 关于技术和可选的基本信息。 可是,我知道它仍然是必要的。 因此,要知道如何创建解析,也就是说,程序分析器,你需要了解以下内容:

  • 对于初始编程操作算法需要的源代码,网页,这是一个供体的彻底分析。 有离不开照排技术的至少平均知识。 这HTML,CSS和JavaScript语言。
  • 为了更深入地研究的主题,你需要学习一门叫DOM技术。 它提供了一个机会,从网页层次非常有效地工作。
  • 最困难的阶段 - 编写一个解析器。 这里有必要具备处理文字的工具。 有经验的程序员常常用于此目的,正则表达式,这是足够强大。 但它的实力并不每个开发人员。 在这里,你需要一个特殊的情结。 最佳的解决方案是使用用于进行解析专门创建一个现成的库。 这是什么库? 它是挤满了程序代码,其中已经包含了所有的功能进行分析。
  • 人们非常希望了解面向对象的编程,它是由任何编程语言支持。
  • 最后阶段涉及处理数据的结果的分析,被构造和被存储。 有离不开数据库的知识。
  • 我们需要的适合处理文件功能的知识和拥有。 毕竟,数据需要写入这些相同的文件,然后,也许,被转换成电子表格格式。

阶段

如果满足所有要求,随后的过程可以分为个阶段:

  1. 在分析的第一阶段获得源代码的网页。
  2. 下一步 - 提取标记的必要数据。 有被丢弃不必要的代码,所述信息是根据所述层次结构进行组织。
  3. 后成功的数据应存储在的形式,可被进一步加工。
  4. 由于该网站不包含一个单页的,从集,算法应该能够移动到下一个页面。

因此,解析 - 是什么呢? 这是分析网站内容,并分离出所需要的信息的过程。 使用以上信息,就可以自动填充他们的网站很多内容。 这使得有可能赢得时间,赢得了市场saytostroiteley艰难的竞争。

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 zhcn.birmiss.com. Theme powered by WordPress.