日期:2014-05-16  浏览次数:20517 次

Oracle 数据类型及存储方式

it's from?http://www.iteye.com/topic/220760

?

?

Oracle 数据类型及存储方式 
袁光东 原创 
概述 
通过实例,全面而深入的分析oralce的基本数据类型及它们的存储方式。以ORACLE 10G为基础,介绍oralce 10g引入的新的数据类型。让你对oracle数据类型有一个全新的认识。揭示一些不为人知的秘密和被忽略的盲点。从实用和优化的角度出发,讨论每种数据类型的特点。从这里开始oracle之旅! 
第一部份 字符类型 
§1.1  char 
定长字符串,会用空格来填充来达到其最大长度,最长2000个字节。 

1.	新建一个测试表test_char.,只有一个char类型的列。长度为10 
SQL> create table test_char(colA char(10)); 
Table created 
2.	向这个表中插入一些数据。 
SQL> insert into test_char values('a'); 

1 row inserted 

SQL> insert into test_char values('aa'); 

1 row inserted 

SQL> insert into test_char values('aaa'); 

1 row inserted 

SQL> insert into test_char values('aaaa'); 

1 row inserted 

SQL> insert into test_char values('aaaaaaaaaa'); 
1 row inserted 

注意:最多只能插入10个字节。否是就报错。 
SQL> insert into test_char values('aaaaaaaaaaa'); 

insert into test_char values('aaaaaaaaaaa') 

ORA-12899: value too large for column "PUB_TEST"."TEST_CHAR"."COLA" (actual: 11, maximum: 10) 

3.	使用dump函数可以查看每一行的内部存数结构。 
SQL> select colA, dump(colA) from test_char; 

COLA       DUMP(COLA) 
---------- -------------------------------------------- 
a          Typ=96 Len=10: 97,32,32,32,32,32,32,32,32,32 
aa         Typ=96 Len=10: 97,97,32,32,32,32,32,32,32,32 
aaa        Typ=96 Len=10: 97,97,97,32,32,32,32,32,32,32 
aaaa       Typ=96 Len=10: 97,97,97,97,32,32,32,32,32,32 
aaaaaaaaaa Typ=96 Len=10: 97,97,97,97,97,97,97,97,97,97 

注意:Typ=96 表示数据类型的ID。Oracle为每一种数据类型都进行了编号。说明char类型的编号是96. 
Len =10 表示所在的内部存储的长度(用字节表示)。虽然第一例只存了一个字符’a’,但是它还是占用了10个字节的空间。 
97,32,32,32,32,32,32,32,32,32 表示内部存储方式。可见oracle的内部存储是以数据库字符集进行存储的。 
97正好是字符a的ASCII码。 
可以使用chr函数把ASCII码转成字符。 
SQL> select chr(97) from dual; 

CHR(97) 
------- 
a 

要想知道一个字符的ASCII码,可以使用函数ascii 
SQL> select ascii('a') from dual; 

ASCII('A') 
---------- 
        97 

32正好是空格的ascii码值。 
Char类型是定长类型。它总会以空格来填充以达到一个固定宽度。 
使用char类型会浪费存储空间。 
Oracle的数据类型的长度单位是字节。 
SQL> select dump('汉') from dual; 

DUMP('汉') 
--------------------- 
Typ=96 Len=2: 186,186 

可见一个汉字在oracle中是占用了两个字节的。 
英文字母或符号只占用一个字节。 
Char(10)最多可存放5个汉字。 
§1.2  varchar2 
是一种变长的字符类型。最多可占用4000字节的存储空间。 
1.	创建一个表,只有一列,类型为varchar2,长度为10 
SQL> create table test_varchar( col varchar2(10)); 

Table created 
2. 插入一些数据 
SQL> insert into test_varchar values('a'); 

1 row inserted 

SQL> insert into test_varchar values('aa'); 

1 row inserted 

SQL> insert into test_varchar values('aaa'); 

1 row inserted 

SQL> insert into test_varchar values('aaaaaaaaaa'); 

1 row inserted 

SQL> insert into test_varchar values('aaaaaaaaaaa'); 

2.	用dump函数查看每一行的内部存储结构。 
SQL> select col, dump(col) from test_varchar; 

COL        DUMP(COL) 
---------- -------------------------------------------- 
a          Typ=1 Len=1: 97 
aa         Typ=1 Len=2: 97,97 
aaa        Typ=1 Len=3: 97,97,97 
aaaaaaaaaa Typ=1 Len=10: 97,97,97,97,97,97,97,97,97,97 


Typ=1,说明varchar2类型在oracle中的类型编号为1 
Len代表了每一行数据所占用的字节数。 
后面是具体的存储值。 
由此可见,varchar2是存多少就占用多少空间。比较节省空间的。不会像char那样用空格填充。 

§1.3  byte 和char 
在10g中,字符类型的宽度定义时,可以指定单位。 
Byte就是字节。 
Char就是字符。 
Varchar2(10 byte) 长度为10个字节。 
Varchar2(10 char) 长度为10个字符所占的长度。 
Char(10 byte)长度为10个字节。 
Char(10 char) 长度为10个字符所占的长度。 
一个字符占用多少个字节,是由当前系统采用的字符集来决定的。 
如一个汉字占用两个字节。 

查看当前系统采用的字符集 
SQL> select * from nls_database_parameters where parameter ='NLS_CHARACTERSET'; 

PARAMETER                      VALUE 
------------------------------ -------------------------------------------- 
NLS_CHARACTERSET               ZHS16GBK 

如果在定义类型时,不指定单位。默认是按byte,即以字节为单位的。 
采用char为单位的好处是,使用多字节的字符集。 
比如,在ZHS16GBK字符集中,一个汉字占用两个字节。 
把数据表的某一列长度定义为可存放10个汉字,通过下面的定义就可以了。 
Create table test_varchar(col_char  varchar2(10 char)); 
这样相对简单一些。在数据库表设计时需要注意。 

继续实验,新建一个表,包含两列。一列采用byte为单位,一列采用char为单位 
SQL> create table test_varchar2 (col_char varchar2(10 char),col_byte varchar2(10 byte)); 

Table created 

Col_char列,定义为可存放10个字符。 
Col_byte 列,定义为可存放10个字节的字符。 
当前的系统采用字符集为ZHS16GBK.所以一个字符占两个字节。 
试着在表中插入一些数据 
SQL> insert into tes