30,745 讀數

压缩彩票号码

经历 Alex6m2023/10/01

太長; 讀書

彩票充满了不可预测性，但窥视幕后并探索这些游戏的怪癖是很有趣的。无论您是玩家还是好奇的观察者，数字世界总有一两个惊喜。

在我的各国，一个每星期一起的乐透这款网游，陆续体验者从 37 个电话机号池选定择 6 个电话机号，而后从 7 个电话机号池选定择另同1个电话机号。就让们大家关注这款网游的首要部件，忽略掉从 1 个电话机号池选定择同1个另外电话机号。 7.

当涉及到的 k/N 方式的彩票玩法时，至少 k 是 N 个电话号码次数统计（在公司的例证中为 37）中均需选泽的次数（在公司的例证中为 6），一种通常的的问题是每台这样的阿拉伯数字有差不多的有机会拥有胜出组合名字的三要素。

人们来实验点一下这类大问题。

当我孩子们的网站下载上回收利用了 2009 年至 2023 年 1609 张图案的统筛选据数据表格。

后来，我将 CSV 文件下载中的参数更换为项目：

 { '09/09/2023': [13, 17, 24, 30, 35, 37], '07/09/2023': [7, 17, 19, 25, 35, 37], '05/09/2023': [2, 3, 5, 9, 36, 37], '02/09/2023': [4, 12, 22, 27, 30, 34], '29/08/2023': [6, 8, 15, 19, 26, 31], '26/08/2023': [6, 7, 14, 21, 25, 34], '22/08/2023': [2, 6, 10, 23, 24, 29], ... }

人群中的键代表于免费免费抽奖日期时间，相关联值是是该指定区域免费免费抽奖的反败为胜组装导致的数字6的数组。

完后，我创建活动一位数组，这里面其中包含从工程图纸中得到的各个数字1：

 numbers = np.array(list(lotto.values())).flatten() [13, 17, 24, 30, 35, 37, 7, 17, 19, 25, 35, 37, 2, 3, 5, 9, 36, ...]

下面了来，我核算了数组中每种值的出现了每一次（频次）：

 count = np.bincount(numbers)[1:] [268, 256, 257, 242, 255, 273, 247, 277, 260, 267, 289, 294, 271, 239, 254, 255, 263, 243, 246, 271, 265, 254, 252, 243, 291, 271, 258, 264, 275, 258, 251, 244, 263, 256, 267, 251, 264]

这一些结局意味着，数值 1 被选取了 268 次，数值 2 被选取了 256 次，依某些推。

来看，开奖结论中的账号分散或者较好竖直的。从而进步骤声明这1点，各位能能进行测量来验证通过分散的竖直性。

要自测 N 个简单数字9的等概率公式，是可以遵守如下的方法：

计算 n 次抽奖中每个数字 i = 1, ..., N 出现的观察频率 (Oi)。

使用公式 Ei = (nk) / N 计算每个号码的预期计数 (Ei)，其中 n 是彩票抽奖的总数，k 是每次抽奖中选择的号码数量（在本例中为 6），并且N 是可能数字的总数（在本例中为 37）。

使用 Pearson 统计量或卡方统计量将观察到的计数 (Oi) 与预期计数 (Ei) 进行比较。 Pearson 统计量的公式通常表示为：

使用观察到的计数和预期计数计算卡方统计量。

审理测算考察（这类卡方考察）以确认计算的卡方值是不是具测算显大性。这将益处您评价指标罗马数字的地域分布是不是与等机率下的预计显大各不相同。

这样来计算出的卡方值在数据汇总上不有效地，则得出结论数字5区域划分合理安排均衡，帮助等几率比统计假设。然而，这样 X^2 值有效地，则得出结论紧急制动等几率比。

我要们新创建一两个函数值来运行阿拉伯数字等机率的卡方定期检查：

 def chi2(data, size, expect, p_value = 0.05): pl = size * 1/expect df = expect - 1 x2_crit_1 = stats.chi2.ppf(p_value, df) x2_crit_2 = stats.chi2.ppf(1 - p_value, df) x2 = 0 for i in range(expect): x2 += ((data[i] - pl) ** 2)/pl accepted = x2_crit_1 < x2 < x2_crit_2 if x2_crit_1 < x2_crit_2 else x2_crit_2 < x2 < x2_crit_1 return x2, accepted

该函数返回由卡方统计量和以概率1 - 2 * p-value接受的等概率结果组成的元组，即该离散均匀分布的极值概率较低。

 N = 37 chi2(count, len(numbers), N) (25.0748, True)

肯定，您需要选择 SciPy 库的预置实用功能来审理等慨率的卡方检验员：

 from scipy import stats chi2_statistic, p_value = stats.chisquare(count) (25.074, 0.96053)

给公司从成对起找寻这部分数字9的组合构成：

 from itertools import combinations pairs = list(combinations(range(1, N), 2))

于此步奏完后，我们大家建设一二维行列式来监控这样的对的产生：

 pairs_count = np.zeros([N] * 2, dtype=int) for pair in pairs: for draw in lotto.values(): if pair[0] in draw and pair[1] in draw: pairs_count[pair[0]][pair[1]] += 1 pairs_count = pairs_count[1:, 1:]

这进行新一个四角矩阵算出，如果它说了解 (a, b) 和 (b, a) 等价的事实真相，或者当我们只算出 (a, b) 对的出显多次。

我的函数公式产生：

 counts = pairs_count.flatten() counts = counts[counts > 0] chi2(counts, sum(counts), len(counts)) (589.2721893491138, True)

SciPy 作为：

 chi2_statistic, p_value = stats.chisquare(counts) (589.2721893491124, 0.8698507423203673)

充分考虑三胞胎怎摸样：

 comb3 = list(combinations(range(1, N), 3)) comb3_count = np.zeros([N] * 3, dtype=int) for comb in comb3: for draw in lotto.values(): contains = comb[0] in draw and comb[1] in draw and comb[2] in draw if contains: comb3_count[comb[0]][comb[1]][comb[2]] += 1 comb3_count = comb3_count[1:, 1:, 1:] counts = comb3_count.flatten() counts = counts[counts > 0] chi2(counts, sum(counts), len(counts)) (6457.575829383709, False)

出了难题，可能性是仍然矩阵计算的较高稠密性。卡方值如果低于下临界点卡方阀值：

 6457.575829383709 < 6840.049842653838

既使，当食用SciPy时，但是是：

 chi2_statistic, p_value = stats.chisquare(counts) (6457.575829383886, 0.9999997038479482)

现代，给当我们找到最易转盘抽奖的账号：

 count.argmax() or list(count).index(max(count)) 11

让我门先不要再急于求成下报告的格式。让我门可以一下这是数字6常年来是如何才能发展的：

 year_result = dict() for year in range(2009, 2024): new_dict = {k:v for (k,v) in lotto.items() if str(year) in k} year_result[year] = np.bincount(np.array(list(new_dict.values())).flatten())[1:].argmax() { 2009: 16, 2010: 10, 2011: 11, 2012: 24, 2013: 32, 2014: 34, 2015: 21, 2016: 25, 2017: 5, 2018: 10, 2019: 24, 2020: 11, 2021: 12, 2022: 14, 2023: 11 }

以及，我们的可进行分析随意间转变的叠加转变：

 year_result = dict() arr = [] for year in range(2009, 2024): new_dict = {k:v for (k,v) in lotto.items() if str(year) in k} arr += list(np.array(list(new_dict.values())).flatten()) year_result['2009 - ' + str(year) if year > 2009 else str(year)] = np.bincount(arr)[1:].argmax() { '2009': 16, '2009 - 2010': 10, '2009 - 2011': 11, '2009 - 2012': 20, '2009 - 2013': 20, '2009 - 2014': 20, '2009 - 2015': 34, '2009 - 2016': 20, '2009 - 2017': 10, '2009 - 2018': 10, '2009 - 2019': 10, '2009 - 2020': 10, '2009 - 2021': 10, '2009 - 2022': 24, '2009 - 2023': 11 }

后来，人们还可侦查会不以往造成过是一样的的图片：

 lotto_counts = {} for k, v in lotto.items(): v_str = str(v) if v_str in lotto_counts: lotto_counts[v_str] += [k] else: lotto_counts[v_str] = [k] result = {k: v for k, v in lotto_counts.items() if len(lotto_counts[k]) > 1} { '[13, 14, 26, 32, 33, 36]': ['16/10/2010', '21/09/2010'] }

有趣味性的是，他们新闻事件近乎反复发生了。

每当们结束后大家数据表格全世界的奇妙的旅程时，这一个数据和几率的疯狂电影探索之旅。你们发觉一个多些有趣，的花絮——从成对和三胞胎到发觉最受青睐的数据。

福利彩票充好了无可预估性，但窥窃幕后人并科学探索这部分手游的癖好是很有意思的。即使您是女玩家也是非常好奇的分析者，数据游戏总在1一个神秘礼物。

L O A D I N G
. . . comments & more!