案例解读:Canvas在倒转课堂中的二分类预测应用
2025-08-13 12:18
推入后的网页就如左侧图的界面。
前提来说,都是有资料库才有数学模型,不过在Canvas中都并未无论如何固定的顺序,到时加到资料库或者到时加到数学模型都是可以的。
现在我们到时组织起来一个数学模型,网页“new model”,对model起一个可侦测的名字。简便原先查看。
我会以我的期望以及旧版操控来名称。在此次操控中都面,起叫做talk-vx(下图是第3次组织起来数学模型,所以命叫做talk-v3)。
在网页中都面预选取import资料库的方式,将s3中都面bucket下sagemarker-studio-l中都面驱动器的csv应运而生到数学模型可预选全域中都面,并预选中都面对应资料库集。左侧图为操控示意图。
在所有都操控终结后,预选取对应的资料库集,网页“select dataset”来相符资料库集。
4. 通过期望界定重返与得借助于数学模型
在我的资料库集中都面,talk是这个Gmail点名or未点名,随即说明一下这个期望字段的含义,在talk官署点名1min以上的为1,否则计为0。
在select a column to predict的娱乐节目下,预选取talk为最后期望字段。Canvas很智慧地标记到了是二特征学数学模型。
5. 组织起来数学模型
可以非常快查看一下我们基准的状况,此后可以通过quick build非常快重构数学模型,此后会定时取向到analysis页继续前进一段时间段。
这个过程中都面我们只须要继续前进,别的操控是未的。
6. 已完成数学模型,重返结果
如下图所示,Canvas早已已完成了数学模型模拟,并返回了对照组的结果。
1)对照组方法论角度看
正确度在85.681%,看紧紧是极佳的状况了。但这中都须要说明一个缺陷,什么是对照组?
机器深造中都面的对照组=得借助于对的个数/整体的个数。
我们这中都举个例证。在这个实验者中都面,假如有10个资料库,6个是0,4个是1;而得借助于借助于的10个结果,6个0中都面得借助于借助于了5个0,4个1中都面得借助于借助于了2个1,那么这中都的正确不下就是(5+2)/10 = 70%。
2)不应用于对照组作为封面女郎标准的缘故
Canvas也提供了对照组以外的查询。可以推入scoring的网页来看整个数学模型的得借助于状况。
在下图中都面,须要请注意到最右侧边的资料库是400+的资料库量,而在前篇书评,放到数学模型中都的资料库是2000+的资料库。
这中都就类似我们在应用于机器深造中都面分开特训集和验证集资料库的操控,切借助于来一以外用花钱特训数学模型的得借助于。
通过颜色与条状长度我们可以看出到1是个小以外,0是个大以外,但在得借助于有误的状况中都面,1得借助于为0的与0得借助于为1的这两种有误状况,图上的长度看紧紧是相近的。
但这中都有我们须要顾及看真实的0和1的长度产自,可以知道1得借助于有误的量/实际为1的量>0得借助于有误的量/实际为0的量。
所以可以很清晰地请注意到不互补的资料库用对照组的指标方式并不靠谱。说个相比较点儿的例证,1000条资料库中都面,999个0,1个1,就算把所有都得借助于为0,也能保证其较较高的对照组,99.9%。但在这种状况下,99.9%的对照组对我们实在得借助于时并未什么用处。因为1才是我们努力正确得借助于借助于来的。
3)预选取相混算子作为封面女郎依据
所以这中都我们要用另一种方式来看,用相混算子的方式来推论数学模型的优劣。当然Canvas也提供了查看相混算子的正门。网页“advanced metrics”来查看相混算子。
相混算子中都面,我们须要定义什么是正例,正例就是我们期望的那个免职,在我们这个个案中都面,
因为我们要请注意到的得借助于人是点名的人,也就是talk = 1。于是在右侧上角“positive class”下预选取“1”,那么我们可以很不易请注意到该数学模型在对照组与调离不下两不足之处的状况,分别是62.887%和70.115%。都不是值得请注意较高的状况。
4)相混算子非常快解读
关于相混算子,为了简便解读,通过一个小例证务实几个也就是说方法论。
比如我们从一群人中都面通过资料库得借助于借助于女生。
那么对照组就是TP/(TP+FP),这个值低就是把女孩子也得借助于为女生,说明把我们不该请注意到的也看看借助于来了。 那么调离不下就是TP/(TP+FN),这个值低就是把女生得借助于为了女孩子,说明把我们一心请注意到的也没能看看借助于来。5)Canvas可以有非常细时间段有非常较高的数学模型精准度
送回右侧边的个案,可以请注意到这对照组和调离不下这两个都不是值得请注意较高的高水平,略高于80%。
那么这样的例证,可以说是Canvas的数学模型模拟高水平不足嘛?
当然不可以这么武断地下论据。
因为机器深造数学模型的结果不行,有两种确有:
第一种是资料库不行,说是“garbage in,garbage out”。 第二种是数学模型预选取的不行,每个数学模型都有其适用边界线,表现的优劣。当然这两个确有都未办法无论如何断定。
但用另一种步骤来推论,拿这个资料库通过python花钱过数学模型,依靠自己花钱的数学模型预选取的算法预选取了逻辑重返数学模型。左侧的LR即为预选取的结果。
经过调参后,对照组60.85%,调离不下65.84%。在随之调参此后精准度并不如Canvas处理的好。
如果去应用于Canvas的话,也就是耗损了1/10的时间段与精力,就必定获取非常好的精准度,那么就可以大幅提升日常工作效不下。
送回上面的焦点,通过这两次的相比较,也就是说断定的是资料库质量不较高造成的。
须要对资料库基准或者资料库量须要有所改进。可以再考虑:
用非常多的基准或替换非常依赖于的基准 非常多的资料库量来重新特训。 五、重返比对期望那么重返在此之前的比对期望。
通过同班同学持续发展史资料库顺利进行动态,须要重构得借助于Gmail点名与否的数学模型。 须要一心法相符哪些不当对标记点名相比较最重要,作为原先商品开始运行的一个再考虑抓手。 1. 第一个比对期望重返在第一个比对期望上,未达成得非常好。但Canvas的结果比自己花钱的精准度好,且时间段非常细。所以可以采用Canvas的结果,用Canvas建构的数学模型来得借助于原先的状况。
同时这中都可以再考虑两个迭代方向:
一个是在预选取资料库基准不足之处,须要思考请注意到非常多逻辑上具体的确有资料库基准; 另一个是在资料库量不足之处,造就非常多的业务范围资料库来特训数学模型。但是,在未非常好的解决方案时,Canvas的数学模型结果是一个这两项可以再考虑采纳的结果。
2. 第二个比对期望重返
在第二个比对期望上,可以初步请注意到须要关注的基准。
可以从这个右侧边基准影响往往上须要请注意到哪些基准是对得借助于点名状况有作用的基准。
前6个基准分别是:
相隔在talk官署的时间段段; 相隔在课程与talk官署的总时间段段; 看其他课程并发送传闻沟通的量; 付费到现在的时间段天数; 相隔在老师讲课处的时间段段; 周活跃天数。这些是可以再考虑的前6个基准,但有个额外请注意的段落,只不过地提升talk官署的时间段段是未意义的,所以须要每一次去看什么与talk官署相隔时间段段具体,那些相隔时间段段非常长的与非常细的区别在哪些不足之处等等。
当然这些都是与业务范围集合前进的步骤,但确有是请注意到了每一次可以再考虑的抓手方向。
六、期望与总结
在应用于过程中都面对Canvas有两个期望:
须要连上Corporation的资料库库,获得资料库非常简便,这样须要非常快去预选取资料库并重构特训数学模型。 须要将资料库得借助于终结后的结果返回,例如有返回结果api接口。这样就能辅助原先线上的沟通高等教育花钱到非常非常快又合适的预选了。 总结Canvas是一个非常简便快捷较高效的工具,它的好处如下:
1)有趣快捷易操控,通过应运而生资料库、quick build等快捷已完成细时间段较高精准度的数学模型特训。相比于自己数学模型寄给字符,特训数学模型且随之调参,Canvas降至非常好的精准度也就耗损1/10的时间段。
2)因为数学模型的精准度非常好,特训速度快非常快,可以在也就是说特征工程建设花钱完此后,非常快对资料库状况有个把握,这些资料库须要特训到什么往往。当然未值得请注意好的也就是说特征工程建设处理的话,就可以用逻辑增加全域,随之重构数学模型一心法,请注意到最合适的用作特征学的元素。
3)须要在数学模型结果输借助于后,获取数学模型中都面的基准最重要性,可以再考虑作为具体的抓手元素.
作者:李猛
本文由 @三法 原创发布于人人都是商品总经理。未经许可,全面禁止登载
题图来自 Unsplash,基于CC0协议。
。南京皮肤病治疗费用是多少湘潭看白癜风的医院哪家好
重庆看妇科去什么医院好
西安看妇科到哪家好
西安看男科哪个医院好
-
鸳鸯金楼选举吴德荣为一些公司董事长2021年一些公司亏损950.09万
挖贝网7翌年4日,鸳鸯金楼(870177)样日前称,根据《日本劳动法》及日本公司章程的有关原则上,日本公司第三届董事会第一次联席会议、第三届出资人第一次联席会议于2022年7翌年1日草案并通过:
-
鸳鸯金楼选举吴德荣为公司董事长2021年公司经营不善950.09万
凿出贝网7月末4日,鸳鸯金楼(870177)所发应于称,根据《该诉讼法》及该公司章程的有关明确规定,该公司第三届执行长局第一次代表大会、第三届管理委员会第一次代表大会于2022年7月末1日审议并
- 08-23奥华电子董事会秘书耿叙武被迫辞职王文川接任2021年公司净利2979.48万
- 08-23奥华电子校董会秘书耿叙武辞职王文川接任2021年公司净利2979.48万
- 08-23田中科技与北汽福田下属企业—北京福田西门子公司汽车有限公司签订《供应商开发协议书》
- 08-23田中科技与北汽福田下属企业—北京福田容克斯汽车有限公司签订《供应商开发协议书》
- 08-23侃爷等明星街拍最爱穿的这件衣服,只不过去哪买?
- 08-23球服相撞上生肖,引领新国潮,你是哪个生肖?
- 08-2324岁男生在朋友圈学了一招,脸“烂”了
- 08-23深浅色墙面对比:明亮的斯堪的纳维亚隔壁
- 08-23失联5个月后密春雷被执行7.19亿元,谁宣判了“览海系”?
- 08-23始建于1930世纪末的纽约公寓在大火后的重生