当前位置: 首页 > 编程日记 > 正文

昨天,我用 Python 写了一个婚介模型


作者 | 天元浪子
来源 | CSDN(ID:CSDNnews)

先声明一下:本文纯属七夕应景娱乐之作。如果有人因为遵循本模型提出的择偶理论而导致失恋或单身,除了同情,我不能补偿更多。

在中国的传统节日里,七夕可能是起源最神秘、内涵最深刻的一个了。当然,这不是本文的重点,我们的核心问题是:在七夕这个特有纪念意义的日子,你真的想好了要向TA表白吗?TA 真的是你唯一正确的选择吗?这个婚介模型,也许对你有一些启发。

我的婚介所生意兴隆,无数想找到理想伴侣的单身人士都来光顾。根据颜值、人品、能力、财富等因素,我给每位客户确定了一个素质指数(Quality Index),简写为 qidx。统计发现,qidx 呈现均值 8.0、标准差 0.5 正态分布。

下面是1万客户的 qidx 统计分布图,可以看出绝大多数单身人士的 qidx 位于 7.0~9.0 之间,评价较为负面的和非常优秀的,都属于少数派。

import numpy as np
import matplotlib.pyplot as pltsingles = np.random.normal(loc=8.0, scale=0.5, size=10000)
plt.hist(singles, bins=8, histtype='step')
plt.show()


一般情况下,我的客户缴费 1 次,将获得有 10 次选择机会。我向客户推荐目标的策略基于“门当户对”,总是选择和客户的 qidx 相适应的异性,具体说就是以客户的 qidx 为均值,以 0.1 的方差,按照正态分布随机生成。

通常,客户有两种方式从我为他们推荐的目标中做出选择。第一种是基于传统的择偶观念,具体规则如下:

  1. 有 10% 的客户会对当前的推荐目标一见钟情,不在意双方的 qid 是否匹配。

  2. 如果当前推荐目标的 qid 比客户高,但不超过 0.2,客户选择当前推荐目标的概率,会随剩余选择机会的减少而增加,大约从 0.35 升至 0.8。

  3. 如果当前推荐目标的 qid 比客户高 0.2 以上,客户选择当前推荐目标的概率,会随剩余选择机会的减少而增加,大约从 0.55 升至 1.0。

  4. 如果当前推荐目标的 qid 比客户低,但不超过 0.2,客户选择当前推荐目标的概率,会随剩余选择机会的减少而增加,大约从 0.25 升至 0.7。

  5. 如果当前推荐目标的 qid 比客户低 0.2 以上,求偶者选择当前目标的概率,会随剩余选择机会的减少而增加,大约从 0 升至 0.18。

第二种匹配方式则是基于“麦穗理论”,听起来很高大上。这里省略了关于麦穗理论的讲解,感兴趣的同学可以自行检索。具体说,就是客户在前 4 次的推荐中,不做出选择,只记下其中的最高的 qidx;从第 5 次开始,只要遇到大于或等于前 4 次最高 qidx 的推荐目标,就做出选择。

下面,我分别用两种匹配方式为 1 万名顾客选择配偶,结果会怎样呢?

# -*- encoding: utf-8 -*-import numpy as npclass Single:def __init__(self, qidx, times):self.times = times # 婚介所提供的匹配次数self.counter = 0 # 当前匹配次数self.qidx = qidx # 客户的qidxself.spouse = None # 匹配成功的配偶的qidxself.histroy = list() # 基于麦穗理论的前times/e次的推荐对象的qidxdef math_classical(self, spouse):self.counter += 1if np.random.random() < 0.1:self.spouse = spouseif spouse - self.qidx >= 0.2:if np.random.random() < 1-0.05*(10-self.counter):self.spouse = spouseelif spouse - self.qidx > 0:if np.random.random() < 0.8-0.05*(10-self.counter):self.spouse = spouseelif self.qidx - spouse >= 0.2:if np.random.random() < 0.18-0.02*(10-self.counter):self.spouse = spouseelif self.qidx - spouse >= 0:if np.random.random() < 0.7-0.05*(10-self.counter):self.spouse = spousedef match_technical(self, spouse):self.counter += 1if self.counter < self.times/np.e:self.histroy.append(spouse)elif spouse >= max(self.histroy):self.spouse = spousedef main(math_mode, total=10000, times=10):# 生成总数为total的客户,其qids有正态随机函数生成singles = [Single(np.random.normal(loc=8.0, scale=0.5), times) for i in range(total)]for p in singles:for i in range(10):if p.counter < 10 and not p.spouse:spouse = np.random.normal(loc=p.qidx, scale=0.1)getattr(p, math_mode)(spouse)matched = np.array([(p.qidx, p.spouse) for p in singles if p.spouse])diff = matched[:,0] - matched[:,1]print('----------------------------------')print('成功匹配%d人,成功率%0.2f%%'%(matched.shape[0], matched.shape[0]*100/total))print('客户qidx均值%0.2f,配偶均值%0.2f'%(np.sum(matched[:,0])/matched.shape[0], np.sum(matched[:,1])/matched.shape[0]))print('匹配方差%0.2f,匹配标准差%0.2f'%(diff.var(), diff.std()))print()if __name__ == '__main__':print('基于传统方式择偶的统计结果')main('math_classical')print('基于麦穗理论择偶的统计结果')main('match_technical')

比较两种方案的匹配成功率、匹配成功的客户的平均 qids、匹配成功的客户配偶的平均 qids、客户和配偶的 qids 的方差等,你会发现,这个结果真的有点意思。

基于传统方式择偶的统计结果
----------------------------------
成功匹配10000人,成功率100.00%
客户qidx均值8.00,配偶均值8.02
匹配方差0.01,匹配标准差0.10基于麦穗理论择偶的统计结果
----------------------------------
成功匹配7138人,成功率71.38%
客户qidx均值8.00,配偶均值8.11
匹配方差0.00,匹配标准差0.07

结论:

  1. 基于传统方式的择偶,成功率更高(100% VS 71.38%);

  2. 基于麦穗理论择偶,配偶素质指数更高(8.11 VS 8.02);

  3. 基于麦穗理论择偶,双方qids差的标准差更小(0.07 VS 0.10),这意味着双方匹配更好。

声明:本文为 CSDN 博主「天元浪子」的原创稿件,版权归作者所有。
原文地址:https://blog.csdn.net/xufive/article/details/108214016

更多精彩推荐
  • 鸿蒙加海思,麒麟加龙芯,组合拳能否渡劫“生态”危机

  • 用 Python 详解《英雄联盟》游戏取胜的重要因素!

  • 万字长文总结机器学习的模型评估与调参 | 附代码下载

  • “Talk is cheap, show me the code”你一行代码有多少漏洞?

  • 科普 | 定义 Eth2.0 中的验证者质量

相关文章:

WCF服务一:WCF服务简介

一、回顾开发历史&#xff1a; 软件架构的设计经历了&#xff1a;从面向对象程序&#xff0c;到面向组件程序设计&#xff0c;再到面向服务程序设计。这三种方式都致力于同一个目标&#xff1a;封装和重用。 面向对象程序设计&#xff1a;类封装功能并提供代码重用。 面向组件程…

MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件

作者 | 神经小兮来源 | HyperAI超神经&#xff08;ID&#xff1a;HyperAI&#xff09;内容提要&#xff1a;麻省理工学院在最近 ECCV 2020 上提交的一篇论文中&#xff0c;发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。2020 年&…

DataBind数据核心

作者&#xff1a;飞刀 这一节主要是要讲DataBind&#xff0c;这个在ASP.net中是很重要的东东&#xff0c;几乎所有的控件都需要它来控制数据的操作。也可以说是ASP.net的数据核心。 我们先来看一个简单的例子&#xff1a; <% Page Language"C#" %> <% …

convertViewsetTag方法的一点理解

转自&#xff1a;http://blog.163.com/freemanls126/blog/static/164585061201171210504864/ 前言 首先我们要知道setTag方法是干什么的&#xff0c;SDK解释为 Tags Unlike IDs, tags are not used to identify views. Tags are essentially an extra piece of information tha…

iOS使用Security.framework进行RSA 加密解密签名和验证签名

iOS 上 Security.framework为我们提供了安全方面相关的api&#xff1b; Security框架提供的RSA在iOS上使用的一些小结 支持的RSA keySize 大小有&#xff1a;512&#xff0c;768&#xff0c;1024&#xff0c;2048位支持的RSA 填充方式有三种&#xff1a;NOPadding,PKCS1,OAEP 三…

Android APK反编译详解(附图)

这段时间在学Android应用开发&#xff0c;在想既然是用Java开发的应该很好反编译从而得到源代码吧&#xff0c;google了一下&#xff0c;确实很简单&#xff0c;以下是我的实践过程。 在此郑重声明&#xff0c;贴出来的目的不是为了去破解人家的软件&#xff0c;完全是一种学习…

你不知道的18个Python高效编程技巧

来源 | Python编程时光初识Python语言&#xff0c;觉得python满足了我上学时候对编程语言的所有要求。python语言的高效编程技巧让我们这些大学曾经苦逼学了四年c或者c的人&#xff0c;兴奋的不行不行的&#xff0c;终于解脱了。高级语言&#xff0c;如果做不到这样&#xff0c…

Alisql源码编译安装(详细篇)

前言 AliSQL 在 2016 云栖大会宣布开放源代码之后&#xff0c;迅速就获得了广泛的关注&#xff0c;目前(2016-10-27) star 数目已达 1187&#xff0c;欢迎访问 AliSQL GitHub 项目关注。社区反应也非常活跃&#xff0c;在 Issue 中提了不少反馈建议&#xff0c;其中有一部分是和…

如何给DataGrid添加自动增长列

作者&#xff1a; cuike519的专栏 http://blog.csdn.net/cuike519/我想我们都知道在数据库中如何添加自增长列&#xff0c;我们可以将这个自增长列绑定到DataGrid上使得用户方便的知道现在是第几行&#xff0c;今天我介绍一种不用数据库就可以简单显示出自增长列的方法&…

达摩院NLP团队斩获六项世界冠军背后,让AI没有难懂的语言

2018年末&#xff0c;BERT横空出世&#xff0c;它采用自编码对句子进行表示&#xff0c;通过预测掩盖词和上下句之间的关系作为语言模型学习任务&#xff0c;使用更多的数据&#xff0c;更大的模型&#xff0c;在多个自然语言处理&#xff08;NLP&#xff09;任务中显著超越之前…

提权巧用RAR.EXE

rar.exe是什么&#xff1f;它就是大名鼎鼎的winrar自带的命令行解压程序。在提权中我们经常要下载各种敏感文件&#xff0c;比如:SU目录。你想一下&#xff0c;如果su目录文件这么多&#xff0c;难道你要一个个的下载&#xff1f;&#xff1f;这明显就很麻烦&#xff0c;有了ra…

OSGI企业应用开发(二)Eclipse中搭建Felix运行环境

上篇文章介绍了什么是OSGI以及使用OSGI构建应用的优点&#xff0c;接着介绍了两款常用的OSGI实现&#xff0c;分别为Apache Felix和Equinox&#xff0c;接下来开始介绍如何在Eclipse中使用Apache Felix和Equinox搭建OSGI运行环境。 一、搭建Apache Felix运行环境 上篇文章中介绍…

马斯克脑机接口、BrainOS相继发布,不努力也能有出路了

作者 | 马超责编 | Carol封图 | CSDN 下载自视觉中国在北京时间的8月29日凌晨&#xff0c;钢铁侠埃隆马斯克投资1亿多美元的脑机接口初创公司公司Neuralink&#xff08;http://www.neurolink.company/&#xff09;进行了一次现场发布会&#xff0c;展示新一代的脑机接口设备。这…

C语言单向链表的实现

一个简单结点的结构体表示为&#xff1a;struct note{int data&#xff1b; /*数据成员可以是多个不同类型的数据*/struct note *next&#xff1b; /*指针变量成员只能是-个*/}&#xff1b; 一个简单的单向链表的图示1&#xff0e;链表是结构、指针相结合…

Java开发常用Linux命令

1.查找文件 find / -name filename.txt根据名称查找/目录下的filename.txt文件。 find . -name "*.xml"递归查找所有的xml文件 find . -name "*.xml" |xargs grep "hello world"递归查找所有文件内容中包含hello world的xml文件 grep -H spring …

数据库开发基本操作-安装Sql Server 2005出现“性能监视器计数器要求”错误解决方法...

今天在安装SQL Server 2005时&#xff0c;出现“性能监视器计数器要求”错误&#xff0c;因为以前出现过这种错误&#xff0c;得到了解决。今天又又出现这种错误&#xff0c;但并不是很清楚当时的解决办法&#xff0c;所以这次把解决方法记录下来&#xff0c;供自己以后参考&am…

华为昇腾师资培训沙龙·南京场 |华为昇腾 ACL 语言开发实践全程干货来了!看完就实操系列...

自今年疫情以来&#xff0c;AI 技术加速进入了人们的视线&#xff0c;在抗疫过程中发挥了重要作用&#xff0c;产业发展明显提速&#xff0c;我国逐步走出了一条由需求导向引领商业模式创新、市场应用倒逼基础理论和关键技术创新的发展道路&#xff0c;AI 人才的争夺战也正式打…

设计模式之C#实现---Builder

作者&#xff1a;cuike519的专栏 http://blog.csdn.net/cuike519/我们将要介绍一个和它比较像的创建型模式 Builder &#xff08;至于关于 Builder 的详细内容您可以参考 GOF 的书&#xff0c;在这里不重复了。&#xff09;。在 GOF 的书里 Builder 的目的是这样的&#xff1…

微信小程序开发之不能使用eval函数的问题

2019独角兽企业重金招聘Python工程师标准>>> 一 eval函数问题 JavaScript中的eval函数是颇受开发者争议的问题之一&#xff0c;问题主要在于其可能导致的不安全性。有关此方面问题&#xff0c;在此不再赘述&#xff0c;读者可能很容易地浏览到许多介绍性文章。 但是…

设计模式之C#实现--FactoryMethod

作者&#xff1a;cuike519的专栏 http://blog.csdn.net/cuike519/工厂方法的目的很明确就是定义一个用来创建对象的接口&#xff0c;但是他不直接创建对象&#xff0c;而由他的子类来创建&#xff0c;这样一来就将创建对象的责任推迟到了该接口的子类中&#xff0c;创建什么类…

美国AI博士指出,自学Python到底能做什么

我见过市面上很多的 Python 讲解教程和书籍&#xff0c;他们大都这样讲 Python 的&#xff1a;先从 Python 的发展历史开始&#xff0c;介绍 Python 的基本语法规则&#xff0c;Python 的 list, dict, tuple 等数据结构&#xff0c;然后再介绍字符串处理和正则表达式&#xff0…

关于微博溯源的后续问题

1、在进行关键词搜索的时候&#xff0c;如何分词&#xff0c;我们不可能用语料库进行匹配&#xff0c;已没有语料可以学习。 2、关于转折点的寻找。目前我们使用高级搜索&#xff0c;从当前时间往前推&#xff0c;根据搜索到微博的条数变化&#xff0c;确定时间发生具体时间&am…

python3的数据类型以及模块的含义

python3的数据类型以及模块的含义购物车转载于:https://blog.51cto.com/11834445/1884901

设计模式之C#实现---- ProtoType

作者&#xff1a; cuike519的专栏 http://blog.csdn.net/cuike519/该模式的意图是&#xff1a;用原型实例指定创建对象的种类&#xff0c;并且通过拷贝这些原型创建新的对象。那么首先我们应该已经有了一个对象&#xff0c;同时这个对象还支持自我复制&#xff08;科隆&…

快速排序(二)最后修改

1 //2012-07-162 void quickSort(element list[], int left, int right)//快速排序3 {4 int ileft;5 int jright;6 7 if(i > j) //判断需要i<j8 return;9 10 element templist[i]; 11 12 while(i<j) 13 { 14 while(i<j …

性能超越GPU、FPGA,华人学者提出软件算法架构加速AI实时化

作者 | 王言治&#xff0c;美国东北大学电子与计算机工程系助理教授出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;近年来&#xff0c;机器学习(Machine Learning)领域的研究和发展可谓是与日俱新&#xff0c;各式各样与机器学习相关的研究成果与应用层出不穷&#…

PHP获取毫秒时间戳,利用microtime()函数

PHP获取毫秒时间戳&#xff0c;利用microtime()函数 php本身没有提供返回毫秒数的函数&#xff0c;但提供了一个microtime()函数&#xff0c;借助此函数&#xff0c;可以很容易定义一个返回毫秒数的函数。php的毫秒是没有默认函数的&#xff0c;但提供了一个microtime()函数&am…

.NET中添加控件数组

作者&#xff1a;cuike519的专栏 http://blog.csdn.net/cuike519/添加控件数组 在.NET里面我好像没有找到有关于控件数组的说明,但是前两天偶在网上看到了一篇关于如何在.NET里面实现控件数组的文章(该文章请参看MSDN).记得大学的时候在使用VB的时候使用过控件数组,可是到了…

如何在机器学习的框架里实现隐私保护?

编者按&#xff1a;数据时代&#xff0c;人们从技术中获取便利的同时&#xff0c;也面临着隐私泄露的风险。微软倡导负责任的人工智能&#xff0c;因此机器学习中的隐私保护问题至关重要。本文介绍了目前机器学习中隐私保护领域的最新研究进展&#xff0c;讨论了机密计算、模型…

函数图像轻松画:教你用永中图象

函数图像轻松画&#xff1a;教你用永中图象 函数图像轻松画&#xff1a;教你用永中图象转载于:https://blog.51cto.com/premium/933220