【案例分享】降维案例探究
降维案例
(资料图片仅供参考)
案例一步骤步骤一步骤二步骤三
案例一
探究: 用户对物品类别的喜好细分降维.
数据:
products.csv 商品信息order_products__prior.csv 订单与商品信息orders.csv 用户的订单信息aisles.csv 商品所属具体物品类别
步骤
合并各张表到一张表当中: pd.merge()建立一个类似行, 列数据使用 PCA 分析
步骤一
import pandas as pdfrom sklearn.decomposition import PCA# 读取四张表的数据prior = pd.read_csv("order_products__prior.csv")products = pd.read_csv("products.csv")orders = pd.read_csv("orders.csv")aisles = pd.read_csv("aisles.csv")# 合并四张表到一张表_mg = pd.merge(prior, products, on=["product_id", "product_id"])_mg = pd.merge(_mg, orders, on=["order_id", "order_id"])mt = pd.merge(_mg, aisles, on=["aisle_id", "aisle_id"])print(mt.head())输出结果:0 2 33120 ... 8.0 eggs1 26 33120 ... 7.0 eggs2 120 33120 ... 10.0 eggs3 327 33120 ... 8.0 eggs4 390 33120 ... 9.0 eggs
步骤二
import pandas as pdfrom sklearn.decomposition import PCA# 读取四张表的数据prior = pd.read_csv("order_products__prior.csv")products = pd.read_csv("products.csv")orders = pd.read_csv("orders.csv")aisles = pd.read_csv("aisles.csv")# 合并四张表到一张表_mg = pd.merge(prior, products, on=["product_id", "product_id"])_mg = pd.merge(_mg, orders, on=["order_id", "order_id"])mt = pd.merge(_mg, aisles, on=["aisle_id", "aisle_id"])# 交叉表 (特殊的分组工具)cross = pd.crosstab(mt["user_id"],mt["aisle"])# 输出头5条数据print(cross.head())输出结果:aisle air fresheners candles asian foods ... white wines yogurtuser_id ... 1 0 0 ... 0 12 0 3 ... 0 423 0 0 ... 0 04 0 0 ... 0 05 0 2 ... 0 3
步骤三
import pandas as pdfrom sklearn.decomposition import PCA# 读取四张表的数据prior = pd.read_csv("order_products__prior.csv")products = pd.read_csv("products.csv")orders = pd.read_csv("orders.csv")aisles = pd.read_csv("aisles.csv")# 合并四张表到一张表_mg = pd.merge(prior, products, on=["product_id", "product_id"])_mg = pd.merge(_mg, orders, on=["order_id", "order_id"])mt = pd.merge(_mg, aisles, on=["aisle_id", "aisle_id"])# 交叉表 (特殊的分组工具)cross = pd.crosstab(mt["user_id"], mt["aisle"])# 进行主成分分析pca = PCA(n_components=0.9)data = pca.fit_transform(cross)# 输出数据print(data)输出结果:[[-2.42156587e+01 2.42942720e+00 -2.46636975e+00 ... 6.86800336e-01 1.69439402e+00 -2.34323022e+00] [ 6.46320806e+00 3.67511165e+01 8.38255336e+00 ... 4.12121252e+00 2.44689740e+00 -4.28348478e+00] [-7.99030162e+00 2.40438257e+00 -1.10300641e+01 ... 1.77534453e+00 -4.44194030e-01 7.86665571e-01] ... [ 8.61143331e+00 7.70129866e+00 7.95240226e+00 ... -2.74252456e+00 1.07112531e+00 -6.31925661e-02] [ 8.40862199e+01 2.04187340e+01 8.05410372e+00 ... 7.27554259e-01 3.51339470e+00 -1.79079914e+01] [-1.39534562e+01 6.64621821e+00 -5.23030367e+00 ... 8.25329076e-01 1.38230701e+00 -2.41942061e+00]]
查看 data.shape, 我们可以发现 类别由 134 个变为了 27 个.
标签:
相关推荐:
最新新闻:
- 前端ol是啥意思是什么?前端开发基础入门--HTML
- 松下官宣:停止生产蓝光刻录碟 此前已生产3.3亿片!:世界热门
- 【案例分享】降维案例探究
- word07目录如何生成?word07目录右侧页码怎样对齐?
- 开机要按f1怎么解决?开机启动项怎么设置?
- 什么是数据库系统?数据库系统有什么特点?
- 诊断卡代码是什么意思?电脑主板故障诊断卡代码大全
- 石油是什么?油气地质储量及其分级:实时焦点
- 搜狐视频怎么看不了?如何下载搜狐网站里的视频?
- skype无法登录怎么解决?skype无法登录的操作方法
- Request、Form、Query、params的使用方法
- dnf怎么上不去了是什么原因?电脑登不上dnf的解决方法
- 怎么把内存分给显卡?怎么看电脑内存显卡?
- 一般试卷的纸张大小是多少?试卷标准字体大小是多少?|每日播报
- wupdmgr.exe文件是什么?wupdmgr.exe文件信息介绍
- 电话在线怎么激活win8.1?电话激活win8.1的具体方法
- 郑码输入法:170个组字能力强的形码输入方法_视讯
- 电脑任务栏没有声音图标是怎么回事?电脑任务栏没有声音图标解决方法
- DX11安装路径是什么?DX11安装路径位置
- 如何安装12306根证书?安装12306根证书的操作教程
- 手机如何进行彩信设置?已中国移动为例详解设置方法
- 诺顿磁盘医生是什么软件?诺顿磁盘医生使用方法介绍
- xp桌面美化怎么操作?电脑桌面美化软件哪个好用?
- 天天快消息!数位板用什么软件好?ps和CorelPainter的使用方法
- 微信夜间模式是什么意思?手机如何切换夜间模式?
- win10第三方软件模糊是什么原因?win10第三方软件模糊解决方法
- 如何关闭445端口的网络访问权限?两种详细关闭445端口的方法
- 登录百度云提示错误1550010是什么情况?百度云提示错误解决方法
- 苹果App Store打不开怎么办?苹果App Store打不开解决方案
- 《怪奇物语》第五季5月开拍!预计2024年播出 -环球消息
- FPS《量子误差》发布新预告 游戏几乎接近完成_当前快讯
- 不是云南也不是海南 四川春节接待游客人数全国第一
- 环球快消息!饭制《艾尔登法环》DLC预告片:PPT播片有内味儿了!
- 《假面骑士Outsiders》ep.2新预告 4月上线发布
- 手绘风游戏《赎罪:世界树之心》 现已在Steam发售
- 机械硬盘永不为奴!希捷24TB和22 TB硬盘上半年推出,30TB和50TB硬盘Q3推出
- 米斯拉?小米新能源汽车设计效果图曝光
- 2TB约2600元!首款消费级PCIe 5 NVMe SSD在日本上市销售 最高可达10 GB/s
- RTX 4060、RTX 4050大曝光:终于来到2000元档
- 1299 元,森海塞尔新 IE200 耳机上架:配备 7mm 超宽频换能器:世界观热点
- 4位大V回应被《满江红》片方起诉:法院见!|实时焦点
- 第一人称建造掠夺 《Meet Your Maker》2月6日进行开放Beta测试
- 世界滚动:Xbox老大承认2022年Xbox表现不佳:都是我的错
- 环球热门:影院回应暂停电影让观众上厕所:特殊原因 只此一场
- 手握新能源、智能化双重优势,长城汽车车市技术大牛地位稳了!
- 环球热推荐:《Pizza Tower》Steam发售获“好评如潮” 官方却建议玩家暂时不要购买
- 特朗普称可在24小时内解决俄乌冲突是什么情况:环球今亮点
- 世界视点!电竞娱乐消费成春节热门 京东高端游戏笔记本成交额同比增长50%
- 四插槽、800W TDP!英伟达RTX 4090Ti/TITAN显卡曝光
- 40系甜品卡将至!中国显卡制造商向EEC提交RTX 4060/4050显卡
- 国外网友三星990 PRO旗舰SSD仅写入2TB寿命就跌到了95%:申请质保惨遭拒绝
- 《飞越13号房》“反击篇”Steam页面上线 2月2日发售:当前视点
- 《怪奇物语》第五季将于今年5月开拍
- 《死亡空间:重制版》和《木卫四协议》玩法对比
- 春节楼市 | 2023年春节成交同比降14%,个别三四线“返乡置业”露端倪-新消息
- 4.3万亿基金投资出现重大转向,这两个板块卷土重来!_全球播资讯
- SBSettings怎么用?详解iOS系统增强工具SBSettings使用设置教程
- 惠普打印机有哪些型号?惠普打印机型号介绍
- stormmedia可以删除吗?stormmedia文件会自动清空?
- mcafee杀毒软件如何激活?mcafee激活码分享
- 如何刻盘光盘?笔记本电脑刻录光盘步骤
- 如何将U盘内存卡进行低级格式化?内存卡低格工具使用说明
- 怎么解决iexplore.exe应用程序错误?iexplore.exe应用程序错误解决办法
- win7系统中斜箭头符号怎么打?分享斜箭头符号的输出方法
- 系统垃圾怎样清除?系统垃圾可以删除吗?
- streambox ripper是什么?streambox ripper使用方法
- 打开淘宝提示安全证书过期了是怎么回事?对应的解决方案
- 无线网卡不能被电脑识别?宏基4741g网卡驱动安装及网卡介绍
- 如何一键ghost8.3硬盘版备份硬盘?一键ghost8.3硬盘版备份方法
- 虚拟内存最小值太低怎样解决?虚拟内存最大最小值应该怎样设置?
- CAXA电子图板2007怎么激活?破解版安装使用教程
- zinemaker有什么用?zinemaker使用教程
- 弹出U盘提示现在无法停止通用卷怎么解决?弹出U盘提示现在无法停止通用卷解决步骤
- 魔兽显血改键工具怎么用?魔兽显血改键工具使用方法及注意事项
- 德玛西亚符文怎么配?德玛西亚符文天赋及出装?
- iphone怎么设置来电显示?iphone怎么截长图?
- 2022年度百大球星梅西76%得票率夺魁!姆巴佩本泽马分获二三
- 美女主播-53℃玩电脑:13900K、RTX4090成功启动
- 今热点:《消极氛围:急诊室》steam抢测开启 恐怖医疗模拟
- 每日快报!科技圈唯一没有大规模裁员的巨头——苹果还能扛多久?
- 世界观焦点:为什么你总在做无效的提问?
- “反ESG”的声音有哪些?
- 世界即时看!《树上的男爵》:如何完成“孤勇者”的理想一生?
- 二手房市场“满江红”-天天讯息
- 环球速递!比90%笔记本都轻 联想台式主机只有1.07kg