前置知识
01,基础Python 编程
02,数组相关的知识
03,机器学习基础,感知机,神经网络
学习目的:tensorflow大概做什么的(近似”极值“(可能是局部极值)靠近器)
前置知识
01,基础Python 编程
02,数组相关的知识
03,机器学习基础,感知机,神经网络
学习目的:tensorflow大概做什么的(近似”极值“(可能是局部极值)靠近器)
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
日期 | 名称 | 预测01(原算法) | 预测02(新算法) | 实际 | 方向对错 |
---|---|---|---|---|---|
20200101 | 麗年國際控股 | 32.071895 | 14 | ||
20200101 | CTR Holdings | 70.130692 | 14 | ||
20200101 | 尚晉(國際)控股 | 4.307061 | 34.09 | ||
20200101 | 文業集團控股 | 51.175728 | 14 | ||
20200101 | 曠世控股 | 14.986902 | 43.75 | ||
20200101 | 三和精化集團 | 12.56793 | 112 | ||
20200101 | 華和控股集團 | 2.952783 | 0.8 | ||
20200101 | 新石文化投資 | 16.344639 | 121.21 | ||
20200101 | 北控城市資源集團 | -16.629482 | -8.87 | ||
20200101 | 九毛九國際控股 | -0.087655 | 57.73 | ||
20200101 | 雋思集團控股 | -7.234183 | 0.67 | ||
20200101 | Infinity Logistics and Transport Ventures | -10.584425 | 0.67 | ||
20200101 | 上海建橋教育集團 | 1.26449 | 1.03 | ||
20200101 | 佳辰控股集團 | -9.197691 | 15.09 | ||
20200101 | 艾德韋宣集團控股 | 9.163534 | 26.67 | ||
20200101 | 滙景控股 | 0.030239 | 5.29 | ||
20200101 | 驢跡科技控股 | -6.050739 | -2 |
机器学习十大算法
数据挖掘十大算法总结–核心思想,算法优缺点,应用领域,数据挖掘优缺点
分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM
聚类算法:KMeans
统计学习:EM
关联分析:Apriori
链接挖掘:PageRank
题目:[智造扬中]大航杯电力AI大赛
地址:https://tianchi.aliyun.com/competition/entrance/231602/information
这个项目做了一半就放弃了,主要是数据偏大,本机使用单sql+聚集函数都需10分钟以上.
使用阿里云环境,也有问题,一方面由于sql是阿里定制sql(类似spark的sql),使用挺大的不方便(不支持update,只能select),另一方面,不支持pandas,特征工程时比较头大.
所以后面就放弃了.
这个问题本质上属于时间序列
ipynb 转化(对应notebook文件(图片路径需要重新生成):python_myproject/kaggle_housePrice/house_price01.ipynb)
标题:津南数字制造算法挑战赛【赛场一】
地址:https://tianchi.aliyun.com/competition/entrance/231695/information
Update your browser to view this website correctly. Update my browser now