本篇博文是数据挖掘部分的首篇,思路主要是先聊聊相似度的理论部分,下一篇是代码实战。 我们在比较事物时,往往会用到“不同”,“一样”,“相似”等...
TF-IDF定义及实现 定义 TF-IDF的英文全称是:Term Frequency - Inverse Document Frequency,中文名称词频-逆文档频率,常用于文本挖掘,资讯检索等应用,在nlp以及推荐等领域都是一个常用的指标,用于衡...
一、注册天气获取账号 我使用的知心天气,没有获取天气账号的小伙伴可以去注册一下,知心天气官网:https://www.seniverse.com/ 取得天气获取的API后,可以直接在浏览器中访问测试一下,如下图所示: 这里我就不...
esp32的开发有两种环境,分别是 Arduino 和 esp32-idf。 Arduino 是在 esp32-idf 基础上进行封装的,虽然使用起来比较方便,但是能自由更改的就变少了,适合新手使用。 esp32-idf 开发难度会大一些,但是可操作空...
1. 之前的尝试(失败的尝试) 咸鱼买了3块ESP32开发板。背面写了NODEMCU v1.1,好像这玩意可以直接写lua,也可以刷Micropython写python,还可以用Arduino IDE写c。我想直接用官方库写C。 和乐鑫的这块开发板(ESP...
基于TF-IDF的新闻标签提取 1. 新闻标签 新闻标签是一条新闻的关键字,可以由编辑上传,或者通过机器提取。新闻标签的提取主要用于推荐系统中,所以,提取的准确性影响推荐系统的有效性。同时,对于将标签展示...
一、准备材料 开发板:esp32s3 idf版本:4.4.2 lvgl:8.3.3 注意:lvgl不要选择master分支,编译失败时不好确定问题。 二、创建idf项目 方式一 通过 VSCode 创建项目 在命令面板中搜索 esp-idf new,开始创建项...
利用tf-idf算法搜索出与关键词有关的前K文本 import os from nltk.text import TextCollection from nltk.tokenize import word_tokenize from collections import Counter def find_key(key_word): file_pat...
tf-idf tf-idf是一种用于信息检索的常用加权技术,在文本检索中,用以评估词语对于一个文件数据库中的其中一份文件的重要程度。词语的重要性随着它在文件中出现的频率成正比增加,但同时会随着它在文件数据库中出...