网上关于matplotlib的教程一搜一大堆,看完之后仍是一脸蒙逼,虽然有部分资料确实能解决当下问题,但仍是不知所以然。该系列文章因此诞生,从最核心的功能开始讲起,争取涵盖我能想到的常见图形和业务需求。更多信息请访问官网。本节官网出处。
Python的递归函数
递归(英语:Recursion),又译为递回,在数学与计算机科学中,是指在函数的定义中使用函数自身的方法。递归一词还较常用于描述以自相似方法重复事物的过程。例如,当两面镜子相互之间近似平行时,镜中嵌套的图像是以无限递归的形式出现的。也可以理解为自我复制的过程。
写在爬取新浪微博之前
论文已经来到数据分析阶段,打算从新浪微博中爬取一些数据作为语料进行分析。不算这次,前前后后也写过几次关于新浪微博的爬虫程序,当时需求比较简单,所以也没有深入研究。这次打算爬取新浪微博中关于“贸易战”的所有博文,工作量可谓不小。知己知彼,百战不殆,在开始之前,系统了解一下微博平台还是十分必要的!
二分查找BinarySearch
在计算机科学中,二分查找算法(英语:binary search algorithm),也称折半搜索算法(英语:half-interval search algorithm)、对数搜索算法(英语:logarithmic search algorithm),是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。
二分查找是基于有序数据集合的查找算法,且数据结构必须为数组形式(能通过连续下标访问),比较适合处理中等批量的静态数据(无频繁更新、删除操作,且过大过小的数据量都不好)。
文本情感分析的一些总结
快速排序QuickSort
快速排序是一种基于比较的排序算法。快速排序预先设定一个基准位,从左右两端轮次遍历,将所有小于基准位的元素都放在其左侧,将所有大于基准位的元素都放在其右侧,然后在分别对左侧区间和右侧区间进行上述操作。
选择排序SelectionSort
选择排序是一种基于比较的排序算法,和插入排序一样,选择排序也是将数据集分为已排区间和未排区间,在未排区间中遍历出目标元素,将其和当前位置元素互换,从而完成选择的过程。
冒泡排序BubbleSort
想象一下鲤鱼吐泡泡的场景,一连串从小到大的泡泡从鲤鱼嘴边左摇右摆的浮到水面上(至少画画时是这么表示的。。。具体不曾考究)。冒泡排序和此场景类似,只是比场景多了一系列的比较过程。需要明确的有:
- 因为要确定在这一堆泡泡中到底哪个才是最大的,这样才好让它最先浮上去。
- 在寻找最大的泡泡过程中,只能两两相互比较