菠菜屋

纸上得来终觉浅


  • 首页

  • 标签

  • 分类

  • 归档

  • 日程表

  • 日读

matplotlib学习笔记 - pyplot.plot

发表于 2019-09-25 | 分类于 matplotlib | 阅读次数 ℃
本文字数: 1.1k | 阅读时长 ≈ 1 分钟

网上关于matplotlib的教程一搜一大堆,看完之后仍是一脸蒙逼,虽然有部分资料确实能解决当下问题,但仍是不知所以然。该系列文章因此诞生,从最核心的功能开始讲起,争取涵盖我能想到的常见图形和业务需求。更多信息请访问官网。本节官网出处。

阅读全文 »

Python的递归函数

发表于 2019-09-08 | 分类于 Python | 阅读次数 ℃
本文字数: 2.8k | 阅读时长 ≈ 3 分钟

递归(英语:Recursion),又译为递回,在数学与计算机科学中,是指在函数的定义中使用函数自身的方法。递归一词还较常用于描述以自相似方法重复事物的过程。例如,当两面镜子相互之间近似平行时,镜中嵌套的图像是以无限递归的形式出现的。也可以理解为自我复制的过程。

阅读全文 »

二分查找的变形

发表于 2019-09-06 | 分类于 算法 | 阅读次数 ℃
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

同样是基于有序数据的二分查找,但是当数据中存在相同数据的时候,用上一版的二分查找找到的索引可能不是你想要的,所以存在以下二分查找的四类变形:

  • 查找第一个等于给定值的索引
  • 查找最后一个等于给定值的索引
  • 查找第一个大于等于给定值的索引
  • 查找最后一个小于等于给定值的索引
阅读全文 »

写在爬取新浪微博之前

发表于 2019-08-29 | 分类于 网络爬虫 | 阅读次数 ℃
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

论文已经来到数据分析阶段,打算从新浪微博中爬取一些数据作为语料进行分析。不算这次,前前后后也写过几次关于新浪微博的爬虫程序,当时需求比较简单,所以也没有深入研究。这次打算爬取新浪微博中关于“贸易战”的所有博文,工作量可谓不小。知己知彼,百战不殆,在开始之前,系统了解一下微博平台还是十分必要的!

阅读全文 »

二分查找BinarySearch

发表于 2019-08-26 | 分类于 算法 | 阅读次数 ℃
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

在计算机科学中,二分查找算法(英语:binary search algorithm),也称折半搜索算法(英语:half-interval search algorithm)、对数搜索算法(英语:logarithmic search algorithm),是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。

二分查找是基于有序数据集合的查找算法,且数据结构必须为数组形式(能通过连续下标访问),比较适合处理中等批量的静态数据(无频繁更新、删除操作,且过大过小的数据量都不好)。

阅读全文 »

文本情感分析的一些总结

发表于 2019-08-17 | 分类于 NLP | 阅读次数 ℃
本文字数: 2.2k | 阅读时长 ≈ 2 分钟

情感分析

情感分析的定义有多个版本,通俗理解就是通过对大量文本进行分析,挖掘出用户的情感倾向,最终目的是运用到现实生活中,或辅助决策,或科学研究。

情感分析 ( Sentiment Analysis) ,也称为倾向性分析,是指采用自动化或半自动化手段对基于微博、论坛等在线社交网络产生的主观评论文本内容进行分析、处理、归纳和推导,从中挖掘出用户 ( 个人或群体、组织等) 针对主题、人物、事件等表达的评论、观点和意见的过程。情感倾向性分析的主要对象是网民自主发布的与网络舆情事件相关的文本。

阅读全文 »

快速排序QuickSort

发表于 2019-08-10 | 分类于 算法 | 阅读次数 ℃
本文字数: 663 | 阅读时长 ≈ 1 分钟

快速排序是一种基于比较的排序算法。快速排序预先设定一个基准位,从左右两端轮次遍历,将所有小于基准位的元素都放在其左侧,将所有大于基准位的元素都放在其右侧,然后在分别对左侧区间和右侧区间进行上述操作。

阅读全文 »

选择排序SelectionSort

发表于 2019-08-06 | 分类于 算法 | 阅读次数 ℃
本文字数: 326 | 阅读时长 ≈ 1 分钟

选择排序是一种基于比较的排序算法,和插入排序一样,选择排序也是将数据集分为已排区间和未排区间,在未排区间中遍历出目标元素,将其和当前位置元素互换,从而完成选择的过程。

阅读全文 »

插入排序InsertionSort

发表于 2019-08-03 | 分类于 算法 | 阅读次数 ℃
本文字数: 313 | 阅读时长 ≈ 1 分钟

插入排序是一种基于比较的排序算法,将整个数据集分为已排区间和未排区间,从未排区间中取出首个元素,按逆序方式遍历已排区间,将其插入到合适位置

阅读全文 »

冒泡排序BubbleSort

发表于 2019-07-29 | 分类于 算法 | 阅读次数 ℃
本文字数: 849 | 阅读时长 ≈ 1 分钟

想象一下鲤鱼吐泡泡的场景,一连串从小到大的泡泡从鲤鱼嘴边左摇右摆的浮到水面上(至少画画时是这么表示的。。。具体不曾考究)。冒泡排序和此场景类似,只是比场景多了一系列的比较过程。需要明确的有:

  • 因为要确定在这一堆泡泡中到底哪个才是最大的,这样才好让它最先浮上去。
  • 在寻找最大的泡泡过程中,只能两两相互比较
    阅读全文 »
1234

wsinbol

一屋不扫,何以扫天下
33 日志
12 分类
43 标签
© 2020 小菠菜 | 站点总字数: 47k | 站点阅读时长 ≈ 42 分钟
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Pisces v7.1.1