一、简介:
MySQL是一款经典的关系型数据库管理系统,百万条数据之下的结构化数据均可建立MySQL数据库并利用SQL语法将Excel中的数据进行更便捷、更灵活的数据分析工作。
DBeaver是一款极为便利的数据库管理和开发工具,其图形化界面简单且清晰。DBeaver通过JDBC连接到数据库,可以支持几乎所有的数据库产品。(NoSQL和大数据平台需要开通商业版本,免费版本仅支持SQL数据库,如MySQL、Clickhouse等)
DBeaver+MySQL共同使用以一种非常友好且简单的方式帮助进行数据分析,这里以2022.8月前进行的七批医药集采数据为例,搭建本地MySQL数据库并使其能够在DBeaver界面进行SQL语言分析。
SQL语言学习网址:
https://www.bilibili.com/video/BV12b411K7Zu?spm_id_from=333.337.search-card.all.click
七批药品集采数据整理:
二、软件下载:
2.1MySQL下载、安装及环境配置:
参考视频:
MySQL 8.0保姆级下载、安装及配置教程(我妈看了都能学会)_哔哩哔哩_bilibili
(该视频非常简单地介绍了MySQL8.0的下载及安装步骤,以下为简易文字版)
2.1.1MySQL软件下载:
步骤一:打开网址:www.mysql.com,并点击DOWNLOADS。
步骤二:点击图2链接下载MySQL Community(GPL)社区版。
Tips:
1、 MySQL Enterprise Edition(企业版)及MySQL Cluster CGE(高级集群版)支持更多功能如集群、NoSQL等,需要付费。
2、 一般数据分析使用MySQL(GPL)足够。
步骤三:点击图3中“MySQL Installer for Windows”
步骤四:点击图4中选择离线下载并点击“Download”。
步骤五:点击图5中按钮,进行MySQL下载。
2.1.2MySQL软件安装:
(安装前如以前装过MySQL需要将之前安装的MySQL全部删除。)
步骤一:双击“….msi”文件进行安装
步骤二:选择需要安装的MySQL类型。安装Developer Default,默认安装至C盘;如需安装至其他位置需要选择Custom。
Tips:
在选择安装Custom时,需要先按照“Developer Default-Next-Back”的顺序进行点击,后选择Custom安装,界面如图8所示。按顺序点击”Products To Be Installed“栏中选项,选择“Advanced Options”更改安装目录,如图9界面所示。
步骤三:一直点击“Execute”,至图10界面,默认端口号3306,无需修改需记住。点击Next
步骤四:图11界面选择第二项。
步骤五:图12界面设置root密码,需记住root账户密码。(MySQL会自动生成root账户,该处设置的密码为root账户密码)
步骤六:一直点击Next或Execute,直至MySQL安装完毕。
2.1.3MySQL配置环境变量:
步骤一:右击“此电脑”,选择“属性”,图13位置点击“高级系统设置”。图14位置点击“环境变量”。
步骤二:点击“环境变量”
步骤三:选中系统变量栏中的Path,点击“编辑”。
步骤四:点击“新建”,将MySQL的bin目录黏贴在新建环境变量中。如图16所示。
2.2DBeaver下载及安装:
参考网页:DBeaver安装与使用教程(超详细安装与使用教程)_多喝清晨的粥的博客-CSDN博客_dbeaver教程
步骤一:打开网址:Download | DBeaver Community,选择“Community”版本,根据电脑属性进行安装。
步骤二:一路点击确定即可完成安装。(在选择使用用户时需要选择“For anyone who uses this computer(all users)”选项,详细请看参考网页)
三、数据库资料准备:
将结构化数据在excel中进行整理,并生成csv文件。在这个过程中需要注意以下几点:
1、 csv文件的文件名需要设置为英文名。
2、 csv中的字段名需要设置为英文字段。
这里以“七批全国集采数据”为例建立数据库资料,数据资料二维码附第一章。
将汇总数据:中的字段名称设置为图18中所示。
四、建立数据库:
步骤一:打开DBeaver,点击左上角链接按钮,选择MySQL,点击下一步。
步骤二:在连接设置端口设置“端口”、“用户名”、“密码”。(在安装MySQL时已经设置完成。)
默认设置:
端口 | 用户名 | 密码 |
3306 | Root | *******(安装时设置的密码) |
步骤三:图21页面的“数据库”栏右键,选择“新建数据库”,在图22的弹窗中输入数据库名称。(输入数据库名称需要设置成英语名称。)
步骤四:在图23页面选定需要将表导入的数据库,对“表”栏右键,选择“导入数据”。
步骤四:图24为导入数据的弹窗界面,仅可以导入“.csv”数据。点击“下一步”,选择需要导入的csv文件。需要注意在“Importer settings”中的“Extension”和“Encoding”需要分别设置为“csv”和“utf-8”。点击“下一步-下一步-继续”完成表的建立。
步骤五:图26显示了完成导入的最终界面。
五、进行数据分析:
5.1 数据分析
在图27中点击“SQL编辑器”,选择“新建SQL编辑器”。在图28中SQL编辑器编写界面可以开始写SQL进行数据分析。
5.2 数据导出
图29 为数据导出页面。可以在进行数据分析后点击图29中的红框部分将分析结果进行导出。