通常我们在做数据分析与处理之前,需要把从网站爬取的数据或者从 甲方 系统中导出的数据存入到自己的数据库中。如果数据量小,直接利用 SQL的 Insert 语句逐条插入就好。可是数据量上万条之后,再利用这样的方法就会奇慢无比,让人无法忍受。
最近在优化 台区线损排查分析软件 时遇到从集中器采集的上万条语句的入库,以及 继电保护可靠性评估与检修决策软件 中导入几万条 变电站一次设备的保护告警数据,都需要等待很长时间的问题。虽然解决问题时,是难过的,但搞定之后还是非常的开心。很享受这样的心流体验。
现在,我把解决的方法记录下来,以方便大家在遇到此类问题时作为参考。
最开始,使用 OleDb,打开数据库链接以后,先生成几万条 SQL 的insert
语句,然后循环遍历执行,向数据库中写入记录,慢的出翔了。
不能忍,尝试改进一个版本。
仍然使用 OleDb,采用参数赋值的方法,构造 OleDbParameter,然后循环修改参数,向数据库中写入记录,结果没有性能提升。
不能忍,继续尝试其它的方法。
这次使用 Transaction,通过事务的方式向数据库中写入记录,由于事务将大量的 SQL 语句一次提交处理,所以速度有所提升,但仍然慢的要死。
不能忍,继续尝试改进,要哭死的感觉。
查了很多资料,这次使用 OleDbDataAdapter,利用这个桥接器将插入的数据更改(Update)回数据源,可依然慢的要死。
没有办法,问题需要解决,继续寻找解决方案。
受到这个帖子的启发,这次使用 DAO 的方式。
https://stackoverflow.com/questions/7070011/writing-large-number-of-records-bulk-insert-to-access-in-net-c
结果喜人,把以前5分钟左右的插入问题,3秒钟之内完成,提升10多倍。
1.利用 OleDbDataAdapter 方式。
public void InsertRow(DataTable dataTable)
{
if (IsConnected == false)
throw new Exception("没有与数据库进行连接.");
if (dataTable == null)
throw new ArgumentNullException();
if (string.IsNullOrEmpty(dataTable.TableName))
throw new Exception("DataTable 的 TableName属性需要赋值。");
List<string> columnList = new List<string>();
foreach (DataColumn one in dataTable.Columns)
{
columnList.Add(one.ColumnName);
}
string tableName = dataTable.TableName;
OleDbDataAdapter adapter = new OleDbDataAdapter();
adapter.SelectCommand = new OleDbCommand("select * from " + tableName, _pOleDbConnection);
using (OleDbCommandBuilder builder = new OleDbCommandBuilder(adapter))
{
adapter.InsertCommand = builder.GetInsertCommand();
foreach (string one in columnList)
{
adapter.InsertCommand.Parameters.Add(one, dataTable.Columns[one].DataType);
}
adapter.Update(dataTable);
}
}
2. 利用 DAO 方式。
using Microsoft.Office.Interop.Access.Dao;
public override void InsertRow(DataTable dataTable)
{
if (dataTable == null)
throw new ArgumentNullException();
if (string.IsNullOrEmpty(dataTable.TableName))
throw new Exception("DataTable 的 TableName属性需要赋值。");
List<string> columnList = new List<string>();
foreach (DataColumn one in dataTable.Columns)
{
columnList.Add(one.ColumnName);
}
string fileName = _pConnectionProperty.ParentDirectory + "\\" + _pConnectionProperty.Name;
DBEngine dbEngine = new DBEngineClass();
Database db = dbEngine.OpenDatabase(fileName);
Recordset rs = db.OpenRecordset(dataTable.TableName);
Field[] myFields = new Field[columnList.Count];
for (int i = 0, len = myFields.Length; i < len; i++)
{
myFields[i] = rs.Fields[columnList[i]];
}
for (int i = 0, len = dataTable.Rows.Count; i < len; i++)
{
rs.AddNew();
for (int j = 0;j < myFields.Length; j++)
{
myFields[j].Value = dataTable.Rows[i][j];
}
rs.Update();
}
rs.Close();
db.Close();
}
3. 实验结果。
从Excel中导入的告警数据:
到此为止,利用 C# 向 Access 数据库插入大量数据的方法就介绍完了。希望对大家有用。其实,我们学技能就应该以问题为导向,这些东西在数据库原理的书中是不会涉及的,只有不断的去搜索,去尝试才能把知识内化,为自己所用!好了,就到这里吧!See You!
相关图文:
经过8年多的发展,LSGO软件技术团队在「地理信息系统」、「数据统计分析」、「计算机视觉」等领域积累了丰富的研发经验,也建立了人才培养的完备体系,欢迎对计算机技术感兴趣的同学加入,与我们共同成长进步。
我们图文推送的计划如下,欢迎大家转发!
周一「图书排行:计算机书籍每周销量排行榜」
周二「技术分享:C#语言在工程中的应用」
周三「资料分享:网络上发现的电子资料」
周四「LeetCode实战:算法题目的实现」
周五「猫眼电影:即将上映、最受期待榜」
周六「Github精选:本周10大热门项目」
周日「股市币市:本周交易数据分析与最新公告」
后台回复「搜搜搜」,随机获取电子资源!
欢迎关注,请扫描二维码: