本文是使用splinter过程中,遇到阻碍(主要是动态样式导致element not visiable),而推演出来的基础学习内容。以下内容早在2013年左右就看过,全当复习总结重新来一次,所以html常用的如标题、段落、链接、图像、表格等没有列入。本问内容全部来自:http://www.w3school.com.cn 感谢无私的网站提供的基础学习内容。
HTML基础概念
什么是 HTML?
HTML 是用来描述网页的一种语言。
1 2 3 4
HTML 指的是超文本标记语言 (HyperTextMarkupLanguage) HTML 不是一种编程语言,而是一种标记语言 (markup language) 标记语言是一套标记标签 (markup tag) HTML 使用标记标签来描述网页
HTML 标签
HTML 标记标签通常被称为 HTML 标签 (HTML tag)。
1 2 3 4
HTML 标签是由尖括号包围的关键词,比如 <html> HTML 标签通常是成对出现的,比如 <b> 和 </b> 标签对中的第一个标签是开始标签,第二个标签是结束标签 开始和结束标签也被称为开放标签和闭合标签
A web page should have only one id, so the find_by_id method returns always a list with just one element.
Finding links
If you need to find the links in a page, you can use the methods find_link_by_text, find_link_by_partial_text, find_link_by_href or find_link_by_partial_href. Examples:
As the other find_/* methods, these returns a list of all found elements. You also can search for links using other selector types with the methods find_by_css, find_by_xpath, find_by_tag, find_by_name, find_by_value and find_by_id.
由于最近拓展视野,发现了splinter和 Hp Utf 两个东西,很想去学习,基于django的自动发版系统又不能半途而非(实属自我约束,不能太没有恒心)。故而,更新日志的就不用django的web方式了,因为我尝试了很久,python本来就不熟悉,困难那是重重的,直接上python提供的mysql接口更新git的log日志。以下是代码:
12345678...