关键词匹配优化（第2篇）—— 用C#实现demo_c#

关键词匹配优化（第2篇）—— 用C#实现demo

上一篇文章用python实现了计算文本相似度计算的过程，这次用c#做个demo。

不得不说用python是真的方便，不懂计算过程也能实现结果。c#也有类似numpy的库：numsharp。经过测试还是有区别的，有些功能没有（也可能是因为我没看文档）。最后还是自己研究计算过程去写。

用c#写excel公式有两种开发方式：vsto和exceldna。看了一下vsto的部署感觉比较麻烦，所以这里用exceldna的方式。

求两个词向量的余弦相似度的c#代码如下

        /// <summary>
        /// 求余弦相似度，输入两个只有1行且列数相同的二维数组
        /// </summary>
        /// <param name="vector_a">向量a</param>
        /// <param name="vector_b">向量b</param>
        /// <returns>返回两个向量的余弦相似度</returns>
        public static double cos_sim(int[,] vector_a, int[,] vector_b)
        {
            double num = 0;
            //计算向量a和 向量b转置 的乘积
            //python中的：float(vector_a * vector_b.t)
            for(int i = 0; i < vector_a.getlength(1); i++)
            {
                num += vector_a[0, i] * vector_b[0, i];
            }
            
            double denom =  norm(vector_a) * norm(vector_b);
            double sim = num / denom;
            return sim;
        }

        /// <summary>
        /// 求向量范数，输入一个只有1行的二维数组
        /// </summary>
        /// <param name="vector">输入的向量</param>
        /// <returns>返回向量的范数</returns>
        //类似numpy中的np.linalg.norm
        public static double norm(int[,] vector)
        {
            double sumi = 0;
            foreach(int i in vector)
            {
                sumi += i * i;
            }

            return math.sqrt(sumi);
        }

这个只是初步实现了余弦相似度计算，还有优化的空间。比如这里输入的向量是一行的二维数组，改成用一维数组或者list都可以，类型也可以不用int改成double。

输入的部分先用excel选区输入，后面会改到数据库中，实现效果如下：

返回的字符串后面跟的数字是两个词的相似度，后续删掉即可。

前面的单元格区域“测试!a1:jh154”是目标关键词和向量，之后会把这部分去掉，整理一下存储到数据库中。按照目前的one-hot编码，后续增加关键词时直接给每个关键词后加一个值是0的维度即可，如果改成tf-idf编码，就需要在增加关键词后重新计算向量了。不过怎么说也比维护100多个elseif要方便，后续优化还可以把拆分字换成分词，减少计算量，提高准确度。

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

详细了解C# 枚举与位枚举

一、枚举的概念：　　c# 枚举（enum）, 枚举类型是用于声明一组命名的常数的基本数据类型（值类型）；二、枚举的定义：　　声明enum变量：enum <... [阅读全文]

深入了解c# 匿名类型

一、什么叫做匿名类？　　匿名类就是没有名字的类。匿名类不能被引用，只能再创建的时候用new语句来声明。二、匿名类的优势以及应用场景；　　1、匿名类型提供了一种方... [阅读全文]

C# 对PDF文档加密、解密（基于Spire.Cloud.SDK for .NET）

spire.cloud.sdk for .net提供了接口pdfsecurityapi可用于加密、解密pdf文档。本文将通过c#代码演示具体加密及解密方法。使用... [阅读全文]

C# 实现俄罗斯方块（附源码）

概述俄罗斯方块（tetris）是一款由俄罗斯人阿列克谢·帕基特诺夫发明的休闲游戏，帕基特诺夫爱玩拼图，从拼图游戏里得到灵感，设计出了俄罗斯方块。由于上手简单、老... [阅读全文]

浅析c# 接口

接口：是指定一组函数成员而不是实现他们的引用类型。所以只能类喝啊结构来实现接口，在结成该接口的类里面必须要实现接口的所有方法接口的特点：继承于接口的类，必须要实... [阅读全文]

c# 接口使用实例

用接口实现一个简单的物件的入库，出库如定义一个物流类接口，包含物件所属快递公司名称属性，物件单号属性及信息显示方法。通过物件出库类信息和物件入库类信息继承该接口... [阅读全文]

详解C# 泛型中的数据类型判定与转换

提到类型转换，首先要明确c#中的数据类型，主要分为值类型和引用类型：1.常用的值类型有：（struct）整型家族：int，byte，char，short，lon... [阅读全文]

Unity通用泛型单例设计模式（普通型和继承自MonoBehaviour）

单例模式是设计模式中最为常见的，不多解释了。但应该尽量避免使用，一般全局管理类才使用单例。普通泛型单例：public abstract class single... [阅读全文]

WindowsForm实现警告消息框的实例代码

警告消息框主要是用来向用户户展示诸如警告、异常、完成和提示消息。一般实现的效果就是从系统窗口右下角弹出，然后加上些简单的显示和消失的动画。创建警告框窗口首先我们... [阅读全文]

WindowsForm移动一个没有标题栏的窗口的方法

在winform程序中，要移动没有标题栏的窗口，基本的实现思路是监听需要拖动窗口内的控件的鼠标事件，然后将鼠标位置发送给窗口进行相应的位移就可以了。通过借用wi... [阅读全文]


验证码：

验证码：

关键词匹配优化（第2篇）—— 用C#实现demo

2020年04月14日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论