精通数据库系列之入门-技巧篇

精通数据库系列之入门-技巧篇
  在本例中,我们将实现对一个数据表单的添加、修改、删除以及对表中数据进行查询的功能。本例所使用的计算机软硬件环境为:Windows NT 4.0 Server,MS-SQL Server7.0,Borland Delphi 5,PIII550,256M内存。当然啦,一般的朋友在Win98的环境下或者Win2000的环境下都可以按照本例的步骤来编程序的。笔者的机器主要用作服务器,所以就在服务器上编啦。废话少说,现在开始:
一、数据库设计的基本方法
  数据库设计是建立数据库及其应用系统的核心和基础,它要求对于指定的应用环境,构造出较优的数据库模式,建立起数据库应用系统,并使系统能有效地存储数据,满足用户的各种应用需求。一般按照规范化的设计方法,常将数据库设计分为若干阶段……
二、MS-SQL Server数据库设计示例
  下面,笔者还为各位网友准备了一套数据库大餐,这就是在MS-SQL Server下的Client/Server结构编程示例……
三、数据库编程示例
  在本次讲座中,我们以Delphi5为开发工具,标准的paradox表为后台数据库,来向大家介绍如何进行最简单的数据库编程。在本例中,我们将实现对一个数据表单的添加、修改、删除以及对表中数据进行查询的功能……
四、大型数据库设计原则
  一个好的数据库产品不等于就有一个好的应用系统,如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能。一般来讲,在一个MIS系统分析、设计、测试和试运行阶段,因为数据量较小,设计人员和测试人员往往只注意到功能的实现,而很难注意到性能的薄弱之处,等到系统投入实际运行一段时间后,才发现系统的性能在降低……


数据库设计的基本方法  
  
  数据库设计是建立数据库及其应用系统的核心和基础,它要求对于指定的应用环境,构造出较优的数据库模式,建立起数据库应用系统,并使系统能有效地存储数据,满足用户的各种应用需求。一般按照规范化的设计方法,常将数据库设计分为若干阶段:
  系统规划阶段主要是确定系统的名称、范围;确定系统开发的目标功能和性能;确定系统所需的资源;估计系统开发的成本;确定系统实施计划及进度;分析估算系统可能达到的效益;确定系统设计的原则和技术路线等。对分布式数据库系统,还应分析用户环境及网络条件,以选择和建立系统的网络结构。
  需求分析阶段要在用户调查的基础上,通过分析,逐步明确用户对系统的需求,包括数据需求和围绕这些数据的业务处理需求。通过对组织、部门、企业等进行详细调查,在了解现行系统的概况、确定新系统功能的过程中,收集支持系统目标的基础数据及其处理方法。
  概念设计阶段要产生反映企业各组织信息需求的数据库概念结构,即概念模型。概念模型必须具备丰富的语义表达能力、易于交流和理解、易于变动、易于向各种数据模型转换、易于从概念模型导出与DBMS有关的逻辑模型等特点。
  逻辑设计阶段除了要把E-R图的实体和联系类型,转换成选定的DBMS支持的数据类型,还要设计子模式并对模式进行评价,最后为了使模式适应信息的不同表示,需要优化模式。
  物理设计阶段的主要任务是对数据库中数据在物理设备上的存放结构和存取方法进行设计。数据库物理结构依赖于给定的计算机系统,而且与具体选用的DBMS密切相关。物理设计常常包括某些操作约束,如响应时间与存储要求等。
  系统实施阶段主要分为建立实际的数据库结构;装入试验数据对应用程序进行测试;装入实际数据建立实际数据库三个步骤。
  另外,在数据库的设计过程中还包括一些其他设计,如数据库的安全性、完整性、一致性和可恢复性等方面的设计,不过,这些设计总是以牺牲效率为代价的,设计人员的任务就是要在效率和尽可能多的功能之间进行合理的权衡。
数据库编程示例  
  在本次讲座中,我们以Delphi5为开发工具,标准的paradox表为后台数据库,来向大家介绍如何进行最简单的数据库编程。在本例中,我们将实现对一个数据表单的添加、修改、删除以及对表中数据进行查询的功能。
  本例所使用的计算机软硬件环境为:Windows NT 4.0 Server,Borland Delphi 5,PIII550,256M内存。当然啦,一般的朋友在Win98的环境下或者Win2000的环境下都可以按照本例的步骤来编程序的。笔者的机器主要用作服务器,所以就在服务器上编啦。废话少说,现在开始:
  在正式编写程序之前要有许多准备工作,这当然包括Borland Delphi 5的安装。Delphi5自身带了对标准数据表paradox的驱动(和一些fox系列数据库软件的.db文件是兼容的,这些文件都可以由Delphi直接读取)。
  程序编写的第一步首先是数据表(即.db文件)的建立。在这一步要用到Delphi自带的一个工具叫Database Desktop。这个工具主要用来对表格进行操作,它不仅可以操作像.db文件这样的标准表格,还可以访问像Oracle、SQL Server等大型数据库的文件,功能可以说是很强大的。打开Database Desktop,选择File-New-Table,然后选择paradox7.
    
  在FieldName里面填写你要建立的表单的属性名称,如图所示,本例中要建立的是人员管理表,所以建立的属性为编号、姓名、性别、工作单位、工资、备注等。除工资之外的属性都是字符串类型,即图中Type项所选择的A(Alpha),而Size则是指的字符串的长度,属性值的长度是根据属性的具体意义来确定的,例如“性别”选择只有“男”和“女”,一个汉字的长度,那么性别属性的长度设置成2就可以了(一个汉字等于两个字符的长度)。而工资属性是数值类型的,在paradox中用Number来标记,即和前面对应的一个“N”。属性设置完毕后,选择Save As存盘。本例中,所建立的数据表格的存放路径和文件名为:D:Program FilesBorlandDatabase DesktopWorkDir
yb.db(人员表)。  
  这样就完成了第一步,这一步只是编程之前的准备工作,也是后面针对这个表单编写数据库应用程序的基础。下面要进行的就是实际的程序编写了,请打开Borland Delphi 5。  
  在缺省的Form1上放置这样一些控件(控件的位置就不用俺再罗嗦了吧?):TdataBase、Ttable、TdataSourse、TdbGrid、Tlabel、TdbNavigator。按照你喜欢的界面风格来放置这些控件,下一步就是控件属性的设置啦,这一步也是本例中最关键的一步,因为许多网友对使用前端开发工具对后台数据库进行编程比较生疏,也就是在这个地方。
  我们将Tdatabase的DataBaseName属性设置成Mydb(这个名字可以随便起),drivername为STANDARD(表明驱动的是paradox表),params属性为path=D:Program FilesBorlandDatabase DesktopWorkDir(存放.db文件的路径,前面已经提到),connected设为true(和数据表建立起连接),其他属性使用缺省值就可以了。  
  然后将Table的Databasename属性设为Mydb(即Database1的DataBaseName属性),tablename为ryb.db(即数据表的名字)Active属性设置为True(打开表单,便于编写程序)。  
  接着将Datasourse1的dataset属性设为为Table1(Ttable的name属性值)。另外DBNavigator1和DbGrid1的datasourse属性都设为datasourse1。Tlabel的caption属性设为“数据库编程示例”,如图所示(可以根据个人喜好修改字体,使它变得好看一些)。   >这样控件的属性就设置完毕了,注意到dbgrid里面的“编号”、“姓名”等栏都是数据表中的属性,在ryb.db里面定义,而不是在前端的delphi程序里面定义。点击run按钮之后,这个简单的程序就运行了。  


        这是通过Dbnavigator上的按钮就可以控制对表单进行数据的添加、删除、修改了(将DbNavigator的ShowHint属性改为True的话可以在运行时看到各个按钮的提示)。 
  
  至此,我们实现了使用Delphi这种快速开发工具编写简单的数据库应用程序, 细心的读者可能注意到了,到目前为止连一行程序都没有写,确实是这样,这就是第四代程序设计语言(可视化的编程语言)给我们带来的好处。当然啦,要编写比较复杂的程序不写代码是不可能的,下面我们将在上面的基础上实现查询的功能,并给大家附上源程序。在Form增加如下控件:一个Tquery、一个Tbutton、4个Tlabel、2个Tedit。并将Tlabel的属性进行下图所示的修改(新增加的控件都在黑色方框中):                     
  将Query1的DataBaseName属性也设置成MyDb(和Table一样),SQL属性中写入Select* from ryb,RequestLive设为True(这样可以对Query里面的数据进行修改),然后将Active属性设为True。最后将DataSourse1的DataSet属性改为query1(此时Table1控件可以从Form上去掉了)。  
  双击Button1,在程序编辑器里面写入如下代码:  
Query1.close;  
   Query1.Sql.clear;  
   Query1.SQL.Add(Select * from ryb);  
   Query1.sql.add(where 姓名 like :xm and 工资 > :gz);  
   Query1.ParamByName(xm).asstring:=%+Edit1.text+%;  
If (Edit2.text<>’’)then  
   Query1.ParamByName(gz).value:=strtofloat(Edit2.text);  
   Query1.prepare;  
   Query1.open;   >
  
   这样就完成了查询代码的编写,具体各条语句所引用的函数的含义大家可以参考Delphi的帮助文档,在此就不作赘述了。另外在编写查询程序时,涉及到一些关于数据库查询语言SQL的知识,在后面的文章中我们将有比较详细的介绍。   >此时再执行这个程序,就编程的具有查询功能的数据库程序。在Edit1和Edit2中输入相应的查询条件,然后点击Button1(确定),程序就执行相应的查询操作,查询到的结果将在DBGrid1中显示。  
  到此为止,我们就实现了使用Borland Delphi5操纵paradox数据表的程序示例,当然,这个程序是非常简单的,它实现的只是数据库操作的最基本功能。而且这个程序只是在单击环境下运行的,在设计的时候,我们还不需要考虑一些例如并发性的问题。现在比较成熟的是在客户机/服务器结构下和浏览器/服务器下对数据库进行操作,而且随着网络功能的加入,许多新的问题也带入进来,在后面我们将举这方面的例子,请大家静候佳音吧!


一个好的数据库产品不等于就有一个好的应用系统,如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能。一般来讲,在一个MIS系统分析、设计、测试和试运行阶段,因为数据量较小,设计人员和测试人员往往只注意到功能的实现,而很难注意到性能的薄弱之处,等到系统投入实际运行一段时间后,才发现系统的性能在降低,这时再来考虑提高系统性能则要花费更多的人力物力,而整个系统也不可避免的形成了一个打补丁工程。笔者依据多年来设计和使用数据库的经验,提出以下一些设计准则,供同仁们参考。


命名的规范  
  
  不同的数据库产品对对象的命名有不同的要求,因此,数据库中的各种对象的命名、后台程序的代码编写应采用大小写敏感的形式,各种对象命名长度不要超过30个字符,这样便于应用系统适应不同的数据库。


游标(Cursor)的慎用   
  
  游标提供了对特定集合中逐行扫描的手段,一般使用游标逐行遍历数据,根据取出的数据不同条件进行不同的操作。尤其对多表和大表定义的游标(大的数据集合)循环很容易使程序进入一个漫长的等特甚至死机,笔者在某市《住房公积金管理系统》进行日终帐户滚积数计息处理时,对一个10万个帐户的游标处理导致程序进入了一个无限期的等特(后经测算需48个小时才能完成)(硬件环境:Alpha/4000 128Mram ,Sco Unix,Sybase 11.0),后根据不同的条件改成用不同的UPDATE语句得以在二十分钟之内完成。


示例如下:   
  
Declare Mycursor cursor for select count_no from COUNT


Open Mycursor
Fetch Mycursor into @vcount_no
While (@@sqlstatus=0)
  Begin
       If @vcount_no=’’ 条件1
          操作1
       If @vcount_no=’’ 条件2
          操作2
       。。。
       Fetch Mycursor into @vcount_no
  End
。。。
。。。
改为
Update COUNT set 操作1 for 条件1
Update COUNT set 操作2 for 条件2
。。。
。。。
  在有些场合,有时也非得使用游标,此时也可考虑将符合条件的数据行转入临时表中,再对临时表定义游标进行操作,可时性能得到明显提高。笔者在某地市〈电信收费系统〉数据库后台程序设计中,对一个表(3万行中符合条件的30多行数据)进行游标操作(硬件环境:PC服务器,PII266 64Mram ,NT4.0 Ms Sqlserver 6.5)。 示例如下:
Create #tmp  /* 定义临时表 */
( 字段1
字段2
。。。
)
Insert into #tmp select * from TOTAL where 条件 /* TOTAL中3万行 符合条件只有几十行 */
Declare Mycursor cursor for select * from #tmp
/*对临时表定义游标*/
。。。


索引(Index)的使用原则
  创建索引一般有以下两个目的:维护被索引列的唯一性和提供快速访问表中数据的策略。大型数据库有两种索引即簇索引和非簇索引,一个没有簇索引的表是按堆结构存储数据,所有的数据均添加在表的尾部,而建立了簇索引的表,其数据在物理上会按照簇索引键的顺序存储,一个表只允许有一个簇索引,因此,根据B树结构,可以理解添加任何一种索引均能提高按索引列查询的速度,但会降低插入、更新、删除操作的性能,尤其是当填充因子(Fill Factor)较大时。所以对索引较多的表进行频繁的插入、更新、删除操作,建表和索引时因设置较小的填充因子,以便在各数据页中留下较多的自由空间,减少页分割及重新组织的工作。


数据的一致性和完整性   
  为了保证数据库的一致性和完整性,设计人员往往会设计过多的表间关联(Relation),尽可能的降低数据的冗余。表间关联是一种强制性措施,建立后,对父表(Parent Table)和子表(Child Table)的插入、更新、删除操作均要占用系统的开销,另外,最好不要用Identify 属性字段作为主键与子表关联。如果数据冗余低,数据的完整性容易得到保证,但增加了表间连接查询的操作,为了提高系统的响应时间,合理的数据冗余也是必要的。使用规则(Rule)和约束(Check)来防止系统操作人员误输入造成数据的错误是设计人员的另一种常用手段,但是,不必要的规则和约束也会占用系统的不必要开销,需要注意的是,约束对数据的有效性验证要比规则快。所有这些,设计人员在设计阶段应根据系统操作的类型、频度加以均衡考虑。


事务的陷阱  
  事务是在一次性完成的一组操作。虽然这些操作是单个的操作,SQL Server能够保证这组操作要么全部都完成,要么一点都不做。正是大型数据库的这一特性,使得数据的完整性得到了极大的保证。


  众所周知,SQL Server为每个独立的SQL语句都提供了隐含的事务控制,使得每个DML的数据操作得以完整提交或回滚,但是SQL Server还提供了显式事务控制语句
—- BEGIN TRANSACTION 开始一个事务
—- COMMIT TRANSACTION 提交一个事务
—- ROLLBACK TRANSACTION 回滚一个事务
—- 事务可以嵌套,可以通过全局变量@@trancount检索到连接的事务处理嵌套层次。
  需要加以特别注意并且极容易使编程人员犯错误的是,每个显示或隐含的事物开始都使得该变量加1,每个事务的提交使该变量减1,每个事务的回滚都会使得该变量置0,而只有当该变量为0时的事务提交(最后一个提交语句时),这时才把物理数据写入磁盘。


数据库性能调整   
  在计算机硬件配置和网络设计确定的情况下,影响到应用系统性能的因素不外乎为数据库性能和客户端程序设计。而大多数数据库设计员采用两步法进行数据库设计:首先进行逻辑设计,而后进行物理设计。数据库逻辑设计去除了所有冗余数据,提高了数据吞吐速度,保证了数据的完整性,清楚地表达数据元素之间的关系。而对于多表之间的关联查询(尤其是大数据表)时,其性能将会降低,同时也提高了客 户端程序的编程难度,因此,物理设计需折衷考虑,根据业务规则,确定对关联表的数据量大小、数据项的访问频度,对此类数据表频繁的关联查询应适当提高数据冗余设计。


数据类型的选择   
  数据类型的合理选择对于数据库的性能和操作具有很大的影响,有关这方面的书籍也有不少的阐述,这里主要介绍几点经验。
Identify字段不要作为表的主键与其它表关联,这将会影响到该表的数据迁移。
Text 和Image字段属指针型数据,主要用来存放二进制大型对象(BLOB)。这类数据的操作相比其它数据类型较慢,因此要避开使用。
日期型字段的优点是有众多的日期函数支持,因此,在日期的大小比较、加减操作上非常简单。但是,在按照日期作为条件的查询操作也要用函数,相比其它数据类型速度上就慢许多,因为用函数作为查询的条件时,服务器无法用先进的性能策略来优化查询而只能进行表扫描遍历每行。
  例如:要从DATA_TAB1中(其中有一个名为DATE的日期字段)查询1998年的所有记录。