/ Hex Artifact Content
Login

Artifact 9e70ea1e4e746f23f18180949e94f1bb1c2220d3:


0000: 2f 2a 0a 2a 2a 20 32 30 30 32 20 41 70 72 69 6c  /*.** 2002 April
0010: 20 32 35 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75   25.**.** The au
0020: 74 68 6f 72 20 64 69 73 63 6c 61 69 6d 73 20 63  thor disclaims c
0030: 6f 70 79 72 69 67 68 74 20 74 6f 20 74 68 69 73  opyright to this
0040: 20 73 6f 75 72 63 65 20 63 6f 64 65 2e 20 20 49   source code.  I
0050: 6e 20 70 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20  n place of.** a 
0060: 6c 65 67 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65  legal notice, he
0070: 72 65 20 69 73 20 61 20 62 6c 65 73 73 69 6e 67  re is a blessing
0080: 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79  :.**.**    May y
0090: 6f 75 20 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e  ou do good and n
00a0: 6f 74 20 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d  ot evil..**    M
00b0: 61 79 20 79 6f 75 20 66 69 6e 64 20 66 6f 72 67  ay you find forg
00c0: 69 76 65 6e 65 73 73 20 66 6f 72 20 79 6f 75 72  iveness for your
00d0: 73 65 6c 66 20 61 6e 64 20 66 6f 72 67 69 76 65  self and forgive
00e0: 20 6f 74 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d   others..**    M
00f0: 61 79 20 79 6f 75 20 73 68 61 72 65 20 66 72 65  ay you share fre
0100: 65 6c 79 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e  ely, never takin
0110: 67 20 6d 6f 72 65 20 74 68 61 6e 20 79 6f 75 20  g more than you 
0120: 67 69 76 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a  give..**.*******
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 0a 2a 2a 20 54 68 69 73 20 66 69 6c 65 20  **.** This file 
0180: 63 6f 6e 74 61 69 6e 73 20 68 65 6c 70 65 72 20  contains helper 
0190: 72 6f 75 74 69 6e 65 73 20 75 73 65 64 20 74 6f  routines used to
01a0: 20 74 72 61 6e 73 6c 61 74 65 20 62 69 6e 61 72   translate binar
01b0: 79 20 64 61 74 61 20 69 6e 74 6f 0a 2a 2a 20 61  y data into.** a
01c0: 20 6e 75 6c 6c 2d 74 65 72 6d 69 6e 61 74 65 64   null-terminated
01d0: 20 73 74 72 69 6e 67 20 28 73 75 69 74 61 62 6c   string (suitabl
01e0: 65 20 66 6f 72 20 75 73 65 20 69 6e 20 53 51 4c  e for use in SQL
01f0: 69 74 65 29 20 61 6e 64 20 62 61 63 6b 20 61 67  ite) and back ag
0200: 61 69 6e 2e 0a 2a 2a 20 54 68 65 73 65 20 61 72  ain..** These ar
0210: 65 20 63 6f 6e 76 65 6e 69 65 6e 63 65 20 72 6f  e convenience ro
0220: 75 74 69 6e 65 73 20 66 6f 72 20 75 73 65 20 62  utines for use b
0230: 79 20 70 65 6f 70 6c 65 20 77 68 6f 20 77 61 6e  y people who wan
0240: 74 20 74 6f 20 73 74 6f 72 65 20 62 69 6e 61 72  t to store binar
0250: 79 0a 2a 2a 20 64 61 74 61 20 69 6e 20 61 6e 20  y.** data in an 
0260: 53 51 4c 69 74 65 20 64 61 74 61 62 61 73 65 2e  SQLite database.
0270: 20 20 54 68 65 20 63 6f 64 65 20 69 6e 20 74 68    The code in th
0280: 69 73 20 66 69 6c 65 20 69 73 20 6e 6f 74 20 75  is file is not u
0290: 73 65 64 20 62 79 20 61 6e 79 20 6f 74 68 65 72  sed by any other
02a0: 0a 2a 2a 20 70 61 72 74 20 6f 66 20 74 68 65 20  .** part of the 
02b0: 53 51 4c 69 74 65 20 6c 69 62 72 61 72 79 2e 0a  SQLite library..
02c0: 2a 2a 0a 2a 2a 20 24 49 64 3a 20 65 6e 63 6f 64  **.** $Id: encod
02d0: 65 2e 63 2c 76 20 31 2e 31 30 20 32 30 30 34 2f  e.c,v 1.10 2004/
02e0: 30 31 2f 31 34 20 32 31 3a 35 39 3a 32 33 20 64  01/14 21:59:23 d
02f0: 72 68 20 45 78 70 20 24 0a 2a 2f 0a 23 69 6e 63  rh Exp $.*/.#inc
0300: 6c 75 64 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a  lude <string.h>.
0310: 0a 2f 2a 0a 2a 2a 20 48 6f 77 20 54 68 69 73 20  ./*.** How This 
0320: 45 6e 63 6f 64 65 72 20 57 6f 72 6b 73 0a 2a 2a  Encoder Works.**
0330: 0a 2a 2a 20 54 68 65 20 6f 75 74 70 75 74 20 69  .** The output i
0340: 73 20 61 6c 6c 6f 77 65 64 20 74 6f 20 63 6f 6e  s allowed to con
0350: 74 61 69 6e 20 61 6e 79 20 63 68 61 72 61 63 74  tain any charact
0360: 65 72 20 65 78 63 65 70 74 20 30 78 32 37 20 28  er except 0x27 (
0370: 27 29 20 61 6e 64 0a 2a 2a 20 30 78 30 30 2e 20  ') and.** 0x00. 
0380: 20 54 68 69 73 20 69 73 20 61 63 63 6f 6d 70 6c   This is accompl
0390: 69 73 68 65 64 20 62 79 20 75 73 69 6e 67 20 61  ished by using a
03a0: 6e 20 65 73 63 61 70 65 20 63 68 61 72 61 63 74  n escape charact
03b0: 65 72 20 74 6f 20 65 6e 63 6f 64 65 0a 2a 2a 20  er to encode.** 
03c0: 30 78 32 37 20 61 6e 64 20 30 78 30 30 20 61 73  0x27 and 0x00 as
03d0: 20 61 20 74 77 6f 2d 62 79 74 65 20 73 65 71 75   a two-byte sequ
03e0: 65 6e 63 65 2e 20 20 54 68 65 20 65 73 63 61 70  ence.  The escap
03f0: 65 20 63 68 61 72 61 63 74 65 72 20 69 73 20 61  e character is a
0400: 6c 77 61 79 73 0a 2a 2a 20 30 78 30 31 2e 20 20  lways.** 0x01.  
0410: 41 6e 20 30 78 30 30 20 69 73 20 65 6e 63 6f 64  An 0x00 is encod
0420: 65 64 20 61 73 20 74 68 65 20 74 77 6f 20 62 79  ed as the two by
0430: 74 65 20 73 65 71 75 65 6e 63 65 20 30 78 30 31  te sequence 0x01
0440: 20 30 78 30 31 2e 20 20 54 68 65 0a 2a 2a 20 30   0x01.  The.** 0
0450: 78 32 37 20 63 68 61 72 61 63 74 65 72 20 69 73  x27 character is
0460: 20 65 6e 63 6f 64 65 64 20 61 73 20 74 68 65 20   encoded as the 
0470: 74 77 6f 20 62 79 74 65 20 73 65 71 75 65 6e 63  two byte sequenc
0480: 65 20 30 78 30 31 20 30 78 30 33 2e 20 20 46 69  e 0x01 0x03.  Fi
0490: 6e 61 6c 6c 79 2c 0a 2a 2a 20 74 68 65 20 65 73  nally,.** the es
04a0: 63 61 70 65 20 63 68 61 72 61 63 74 65 72 20 69  cape character i
04b0: 74 73 65 6c 66 20 69 73 20 65 6e 63 6f 64 65 64  tself is encoded
04c0: 20 61 73 20 74 68 65 20 74 77 6f 2d 63 68 61 72   as the two-char
04d0: 61 63 74 65 72 20 73 65 71 75 65 6e 63 65 0a 2a  acter sequence.*
04e0: 2a 20 30 78 30 31 20 30 78 30 32 2e 0a 2a 2a 0a  * 0x01 0x02..**.
04f0: 2a 2a 20 54 6f 20 73 75 6d 6d 61 72 69 7a 65 2c  ** To summarize,
0500: 20 74 68 65 20 65 6e 63 6f 64 65 72 20 77 6f 72   the encoder wor
0510: 6b 73 20 62 79 20 75 73 69 6e 67 20 61 6e 20 65  ks by using an e
0520: 73 63 61 70 65 20 73 65 71 75 65 6e 63 65 73 20  scape sequences 
0530: 61 73 20 66 6f 6c 6c 6f 77 73 3a 0a 2a 2a 0a 2a  as follows:.**.*
0540: 2a 20 20 20 20 20 20 20 30 78 30 30 20 20 2d 3e  *       0x00  ->
0550: 20 20 30 78 30 31 20 30 78 30 31 0a 2a 2a 20 20    0x01 0x01.**  
0560: 20 20 20 20 20 30 78 30 31 20 20 2d 3e 20 20 30       0x01  ->  0
0570: 78 30 31 20 30 78 30 32 0a 2a 2a 20 20 20 20 20  x01 0x02.**     
0580: 20 20 30 78 32 37 20 20 2d 3e 20 20 30 78 30 31    0x27  ->  0x01
0590: 20 30 78 30 33 0a 2a 2a 0a 2a 2a 20 49 66 20 74   0x03.**.** If t
05a0: 68 61 74 20 77 65 72 65 20 61 6c 6c 20 74 68 65  hat were all the
05b0: 20 65 6e 63 6f 64 65 72 20 64 69 64 2c 20 69 74   encoder did, it
05c0: 20 77 6f 75 6c 64 20 77 6f 72 6b 2c 20 62 75 74   would work, but
05d0: 20 69 6e 20 63 65 72 74 61 69 6e 20 63 61 73 65   in certain case
05e0: 73 0a 2a 2a 20 69 74 20 63 6f 75 6c 64 20 64 6f  s.** it could do
05f0: 75 62 6c 65 20 74 68 65 20 73 69 7a 65 20 6f 66  uble the size of
0600: 20 74 68 65 20 65 6e 63 6f 64 65 64 20 73 74 72   the encoded str
0610: 69 6e 67 2e 20 20 46 6f 72 20 65 78 61 6d 70 6c  ing.  For exampl
0620: 65 2c 20 74 6f 0a 2a 2a 20 65 6e 63 6f 64 65 20  e, to.** encode 
0630: 61 20 73 74 72 69 6e 67 20 6f 66 20 31 30 30 20  a string of 100 
0640: 30 78 32 37 20 63 68 61 72 61 63 74 65 72 73 20  0x27 characters 
0650: 77 6f 75 6c 64 20 72 65 71 75 69 72 65 20 31 30  would require 10
0660: 30 20 69 6e 73 74 61 6e 63 65 73 20 6f 66 0a 2a  0 instances of.*
0670: 2a 20 74 68 65 20 30 78 30 31 20 30 78 30 33 20  * the 0x01 0x03 
0680: 65 73 63 61 70 65 20 73 65 71 75 65 6e 63 65 20  escape sequence 
0690: 72 65 73 75 6c 74 69 6e 67 20 69 6e 20 61 20 32  resulting in a 2
06a0: 30 30 2d 63 68 61 72 61 63 74 65 72 20 6f 75 74  00-character out
06b0: 70 75 74 2e 0a 2a 2a 20 57 65 20 77 6f 75 6c 64  put..** We would
06c0: 20 70 72 65 66 65 72 20 74 6f 20 6b 65 65 70 20   prefer to keep 
06d0: 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 20  the size of the 
06e0: 65 6e 63 6f 64 65 64 20 73 74 72 69 6e 67 20 73  encoded string s
06f0: 6d 61 6c 6c 65 72 20 74 68 61 6e 0a 2a 2a 20 74  maller than.** t
0700: 68 69 73 2e 0a 2a 2a 0a 2a 2a 20 54 6f 20 6d 69  his..**.** To mi
0710: 6e 69 6d 69 7a 65 20 74 68 65 20 65 6e 63 6f 64  nimize the encod
0720: 69 6e 67 20 73 69 7a 65 2c 20 77 65 20 66 69 72  ing size, we fir
0730: 73 74 20 61 64 64 20 61 20 66 69 78 65 64 20 6f  st add a fixed o
0740: 66 66 73 65 74 20 76 61 6c 75 65 20 74 6f 20 65  ffset value to e
0750: 61 63 68 20 0a 2a 2a 20 62 79 74 65 20 69 6e 20  ach .** byte in 
0760: 74 68 65 20 73 65 71 75 65 6e 63 65 2e 20 20 54  the sequence.  T
0770: 68 65 20 61 64 64 69 74 69 6f 6e 20 69 73 20 6d  he addition is m
0780: 6f 64 75 6c 6f 20 32 35 36 2e 20 20 28 54 68 61  odulo 256.  (Tha
0790: 74 20 69 73 20 74 6f 20 73 61 79 2c 20 69 66 0a  t is to say, if.
07a0: 2a 2a 20 74 68 65 20 73 75 6d 20 6f 66 20 74 68  ** the sum of th
07b0: 65 20 6f 72 69 67 69 6e 61 6c 20 63 68 61 72 61  e original chara
07c0: 63 74 65 72 20 76 61 6c 75 65 20 61 6e 64 20 74  cter value and t
07d0: 68 65 20 6f 66 66 73 65 74 20 65 78 63 65 65 64  he offset exceed
07e0: 73 20 32 35 36 2c 20 74 68 65 6e 0a 2a 2a 20 74  s 256, then.** t
07f0: 68 65 20 68 69 67 68 65 72 20 6f 72 64 65 72 20  he higher order 
0800: 62 69 74 73 20 61 72 65 20 74 72 75 6e 63 61 74  bits are truncat
0810: 65 64 2e 29 20 20 54 68 65 20 6f 66 66 73 65 74  ed.)  The offset
0820: 20 69 73 20 63 68 6f 73 65 6e 20 74 6f 20 6d 69   is chosen to mi
0830: 6e 69 6d 69 7a 65 0a 2a 2a 20 74 68 65 20 6e 75  nimize.** the nu
0840: 6d 62 65 72 20 6f 66 20 63 68 61 72 61 63 74 65  mber of characte
0850: 72 73 20 69 6e 20 74 68 65 20 73 74 72 69 6e 67  rs in the string
0860: 20 74 68 61 74 20 6e 65 65 64 20 74 6f 20 62 65   that need to be
0870: 20 65 73 63 61 70 65 64 2e 20 20 46 6f 72 0a 2a   escaped.  For.*
0880: 2a 20 65 78 61 6d 70 6c 65 2c 20 69 6e 20 74 68  * example, in th
0890: 65 20 63 61 73 65 20 61 62 6f 76 65 20 77 68 65  e case above whe
08a0: 72 65 20 74 68 65 20 73 74 72 69 6e 67 20 77 61  re the string wa
08b0: 73 20 63 6f 6d 70 6f 73 65 64 20 6f 66 20 31 30  s composed of 10
08c0: 30 20 30 78 32 37 0a 2a 2a 20 63 68 61 72 61 63  0 0x27.** charac
08d0: 74 65 72 73 2c 20 74 68 65 20 6f 66 66 73 65 74  ters, the offset
08e0: 20 6d 69 67 68 74 20 62 65 20 30 78 30 31 2e 20   might be 0x01. 
08f0: 20 45 61 63 68 20 6f 66 20 74 68 65 20 30 78 32   Each of the 0x2
0900: 37 20 63 68 61 72 61 63 74 65 72 73 20 77 6f 75  7 characters wou
0910: 6c 64 0a 2a 2a 20 74 68 65 6e 20 62 65 20 63 6f  ld.** then be co
0920: 6e 76 65 72 74 65 64 20 69 6e 74 6f 20 61 6e 20  nverted into an 
0930: 30 78 32 38 20 63 68 61 72 61 63 74 65 72 20 77  0x28 character w
0940: 68 69 63 68 20 77 6f 75 6c 64 20 6e 6f 74 20 6e  hich would not n
0950: 65 65 64 20 74 6f 20 62 65 0a 2a 2a 20 65 73 63  eed to be.** esc
0960: 61 70 65 64 20 61 74 20 61 6c 6c 20 61 6e 64 20  aped at all and 
0970: 73 6f 20 74 68 65 20 31 30 30 20 63 68 61 72 61  so the 100 chara
0980: 63 74 65 72 20 69 6e 70 75 74 20 73 74 72 69 6e  cter input strin
0990: 67 20 77 6f 75 6c 64 20 62 65 20 63 6f 6e 76 65  g would be conve
09a0: 72 74 65 64 0a 2a 2a 20 69 6e 74 6f 20 6a 75 73  rted.** into jus
09b0: 74 20 31 30 30 20 63 68 61 72 61 63 74 65 72 73  t 100 characters
09c0: 20 6f 66 20 6f 75 74 70 75 74 2e 20 20 41 63 74   of output.  Act
09d0: 75 61 6c 6c 79 20 31 30 31 20 63 68 61 72 61 63  ually 101 charac
09e0: 74 65 72 73 20 6f 66 20 6f 75 74 70 75 74 20 2d  ters of output -
09f0: 20 0a 2a 2a 20 77 65 20 68 61 76 65 20 74 6f 20   .** we have to 
0a00: 72 65 63 6f 72 64 20 74 68 65 20 6f 66 66 73 65  record the offse
0a10: 74 20 75 73 65 64 20 61 73 20 74 68 65 20 66 69  t used as the fi
0a20: 72 73 74 20 62 79 74 65 20 69 6e 20 74 68 65 20  rst byte in the 
0a30: 73 65 71 75 65 6e 63 65 20 73 6f 0a 2a 2a 20 74  sequence so.** t
0a40: 68 61 74 20 74 68 65 20 73 74 72 69 6e 67 20 63  hat the string c
0a50: 61 6e 20 62 65 20 64 65 63 6f 64 65 64 2e 20 20  an be decoded.  
0a60: 53 69 6e 63 65 20 74 68 65 20 6f 66 66 73 65 74  Since the offset
0a70: 20 76 61 6c 75 65 20 69 73 20 73 74 6f 72 65 64   value is stored
0a80: 20 61 73 0a 2a 2a 20 70 61 72 74 20 6f 66 20 74   as.** part of t
0a90: 68 65 20 6f 75 74 70 75 74 20 73 74 72 69 6e 67  he output string
0aa0: 20 61 6e 64 20 74 68 65 20 6f 75 74 70 75 74 20   and the output 
0ab0: 73 74 72 69 6e 67 20 69 73 20 6e 6f 74 20 61 6c  string is not al
0ac0: 6c 6f 77 65 64 20 74 6f 20 63 6f 6e 74 61 69 6e  lowed to contain
0ad0: 0a 2a 2a 20 63 68 61 72 61 63 74 65 72 73 20 30  .** characters 0
0ae0: 78 30 30 20 6f 72 20 30 78 32 37 2c 20 74 68 65  x00 or 0x27, the
0af0: 20 6f 66 66 73 65 74 20 63 61 6e 6e 6f 74 20 62   offset cannot b
0b00: 65 20 30 78 30 30 20 6f 72 20 30 78 32 37 2e 0a  e 0x00 or 0x27..
0b10: 2a 2a 0a 2a 2a 20 48 65 72 65 2c 20 74 68 65 6e  **.** Here, then
0b20: 2c 20 61 72 65 20 74 68 65 20 65 6e 63 6f 64 69  , are the encodi
0b30: 6e 67 20 73 74 65 70 73 3a 0a 2a 2a 0a 2a 2a 20  ng steps:.**.** 
0b40: 20 20 20 20 28 31 29 20 20 20 43 68 6f 6f 73 65      (1)   Choose
0b50: 20 61 6e 20 6f 66 66 73 65 74 20 76 61 6c 75 65   an offset value
0b60: 20 61 6e 64 20 6d 61 6b 65 20 69 74 20 74 68 65   and make it the
0b70: 20 66 69 72 73 74 20 63 68 61 72 61 63 74 65 72   first character
0b80: 20 6f 66 0a 2a 2a 20 20 20 20 20 20 20 20 20 20   of.**          
0b90: 20 6f 75 74 70 75 74 2e 0a 2a 2a 0a 2a 2a 20 20   output..**.**  
0ba0: 20 20 20 28 32 29 20 20 20 43 6f 70 79 20 65 61     (2)   Copy ea
0bb0: 63 68 20 69 6e 70 75 74 20 63 68 61 72 61 63 74  ch input charact
0bc0: 65 72 20 69 6e 74 6f 20 74 68 65 20 6f 75 74 70  er into the outp
0bd0: 75 74 20 62 75 66 66 65 72 2c 20 6f 6e 65 20 62  ut buffer, one b
0be0: 79 0a 2a 2a 20 20 20 20 20 20 20 20 20 20 20 6f  y.**           o
0bf0: 6e 65 2c 20 61 64 64 69 6e 67 20 74 68 65 20 6f  ne, adding the o
0c00: 66 66 73 65 74 20 76 61 6c 75 65 20 61 73 20 79  ffset value as y
0c10: 6f 75 20 63 6f 70 79 2e 0a 2a 2a 0a 2a 2a 20 20  ou copy..**.**  
0c20: 20 20 20 28 33 29 20 20 20 49 66 20 74 68 65 20     (3)   If the 
0c30: 76 61 6c 75 65 20 6f 66 20 61 6e 20 69 6e 70 75  value of an inpu
0c40: 74 20 63 68 61 72 61 63 74 65 72 20 70 6c 75 73  t character plus
0c50: 20 6f 66 66 73 65 74 20 69 73 20 30 78 30 30 2c   offset is 0x00,
0c60: 20 72 65 70 6c 61 63 65 0a 2a 2a 20 20 20 20 20   replace.**     
0c70: 20 20 20 20 20 20 74 68 61 74 20 6f 6e 65 20 63        that one c
0c80: 68 61 72 61 63 74 65 72 20 62 79 20 74 68 65 20  haracter by the 
0c90: 74 77 6f 2d 63 68 61 72 61 63 74 65 72 20 73 65  two-character se
0ca0: 71 75 65 6e 63 65 20 30 78 30 31 20 30 78 30 31  quence 0x01 0x01
0cb0: 2e 0a 2a 2a 20 20 20 20 20 20 20 20 20 20 20 49  ..**           I
0cc0: 66 20 74 68 65 20 73 75 6d 20 69 73 20 30 78 30  f the sum is 0x0
0cd0: 31 2c 20 72 65 70 6c 61 63 65 20 69 74 20 77 69  1, replace it wi
0ce0: 74 68 20 30 78 30 31 20 30 78 30 32 2e 20 20 49  th 0x01 0x02.  I
0cf0: 66 20 74 68 65 20 73 75 6d 0a 2a 2a 20 20 20 20  f the sum.**    
0d00: 20 20 20 20 20 20 20 69 73 20 30 78 32 37 2c 20         is 0x27, 
0d10: 72 65 70 6c 61 63 65 20 69 74 20 77 69 74 68 20  replace it with 
0d20: 30 78 30 31 20 30 78 30 33 2e 0a 2a 2a 0a 2a 2a  0x01 0x03..**.**
0d30: 20 20 20 20 20 28 34 29 20 20 20 50 75 74 20 61       (4)   Put a
0d40: 20 30 78 30 30 20 74 65 72 6d 69 6e 61 74 6f 72   0x00 terminator
0d50: 20 61 74 20 74 68 65 20 65 6e 64 20 6f 66 20 74   at the end of t
0d60: 68 65 20 6f 75 74 70 75 74 2e 0a 2a 2a 0a 2a 2a  he output..**.**
0d70: 20 44 65 63 6f 64 69 6e 67 20 69 73 20 6f 62 76   Decoding is obv
0d80: 69 6f 75 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20  ious:.**.**     
0d90: 28 35 29 20 20 20 43 6f 70 79 20 65 6e 63 6f 64  (5)   Copy encod
0da0: 65 64 20 63 68 61 72 61 63 74 65 72 73 20 65 78  ed characters ex
0db0: 63 65 70 74 20 74 68 65 20 66 69 72 73 74 20 69  cept the first i
0dc0: 6e 74 6f 20 74 68 65 20 64 65 63 6f 64 65 20 0a  nto the decode .
0dd0: 2a 2a 20 20 20 20 20 20 20 20 20 20 20 62 75 66  **           buf
0de0: 66 65 72 2e 20 20 53 65 74 20 74 68 65 20 66 69  fer.  Set the fi
0df0: 72 73 74 20 65 6e 63 6f 64 65 64 20 63 68 61 72  rst encoded char
0e00: 61 63 74 65 72 20 61 73 69 64 65 20 66 6f 72 20  acter aside for 
0e10: 75 73 65 20 61 73 0a 2a 2a 20 20 20 20 20 20 20  use as.**       
0e20: 20 20 20 20 74 68 65 20 6f 66 66 73 65 74 20 69      the offset i
0e30: 6e 20 73 74 65 70 20 37 20 62 65 6c 6f 77 2e 0a  n step 7 below..
0e40: 2a 2a 0a 2a 2a 20 20 20 20 20 28 36 29 20 20 20  **.**     (6)   
0e50: 43 6f 6e 76 65 72 74 20 65 61 63 68 20 30 78 30  Convert each 0x0
0e60: 31 20 30 78 30 31 20 73 65 71 75 65 6e 63 65 20  1 0x01 sequence 
0e70: 69 6e 74 6f 20 61 20 73 69 6e 67 6c 65 20 63 68  into a single ch
0e80: 61 72 61 63 74 65 72 20 30 78 30 30 2e 0a 2a 2a  aracter 0x00..**
0e90: 20 20 20 20 20 20 20 20 20 20 20 43 6f 6e 76 65             Conve
0ea0: 72 74 20 30 78 30 31 20 30 78 30 32 20 69 6e 74  rt 0x01 0x02 int
0eb0: 6f 20 30 78 30 31 2e 20 20 43 6f 6e 76 65 72 74  o 0x01.  Convert
0ec0: 20 30 78 30 31 20 30 78 30 33 20 69 6e 74 6f 20   0x01 0x03 into 
0ed0: 30 78 32 37 2e 0a 2a 2a 0a 2a 2a 20 20 20 20 20  0x27..**.**     
0ee0: 28 37 29 20 20 20 53 75 62 74 72 61 63 74 20 74  (7)   Subtract t
0ef0: 68 65 20 6f 66 66 73 65 74 20 76 61 6c 75 65 20  he offset value 
0f00: 74 68 61 74 20 77 61 73 20 74 68 65 20 66 69 72  that was the fir
0f10: 73 74 20 63 68 61 72 61 63 74 65 72 20 6f 66 0a  st character of.
0f20: 2a 2a 20 20 20 20 20 20 20 20 20 20 20 74 68 65  **           the
0f30: 20 65 6e 63 6f 64 65 64 20 62 75 66 66 65 72 20   encoded buffer 
0f40: 66 72 6f 6d 20 61 6c 6c 20 63 68 61 72 61 63 74  from all charact
0f50: 65 72 73 20 69 6e 20 74 68 65 20 6f 75 74 70 75  ers in the outpu
0f60: 74 20 62 75 66 66 65 72 2e 0a 2a 2a 0a 2a 2a 20  t buffer..**.** 
0f70: 54 68 65 20 6f 6e 6c 79 20 74 72 69 63 6b 79 20  The only tricky 
0f80: 70 61 72 74 20 69 73 20 73 74 65 70 20 28 31 29  part is step (1)
0f90: 20 2d 20 68 6f 77 20 74 6f 20 63 6f 6d 70 75 74   - how to comput
0fa0: 65 20 61 6e 20 6f 66 66 73 65 74 20 76 61 6c 75  e an offset valu
0fb0: 65 20 74 6f 0a 2a 2a 20 6d 69 6e 69 6d 69 7a 65  e to.** minimize
0fc0: 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65   the size of the
0fd0: 20 6f 75 74 70 75 74 20 62 75 66 66 65 72 2e 20   output buffer. 
0fe0: 20 54 68 69 73 20 69 73 20 61 63 63 6f 6d 70 6c   This is accompl
0ff0: 69 73 68 65 64 20 62 79 20 74 65 73 74 69 6e 67  ished by testing
1000: 0a 2a 2a 20 61 6c 6c 20 6f 66 66 73 65 74 20 76  .** all offset v
1010: 61 6c 75 65 73 20 61 6e 64 20 70 69 63 6b 69 6e  alues and pickin
1020: 67 20 74 68 65 20 6f 6e 65 20 74 68 61 74 20 72  g the one that r
1030: 65 73 75 6c 74 73 20 69 6e 20 74 68 65 20 66 65  esults in the fe
1040: 77 65 73 74 20 6e 75 6d 62 65 72 0a 2a 2a 20 6f  west number.** o
1050: 66 20 65 73 63 61 70 65 73 2e 20 20 54 6f 20 64  f escapes.  To d
1060: 6f 20 74 68 61 74 2c 20 77 65 20 66 69 72 73 74  o that, we first
1070: 20 73 63 61 6e 20 74 68 65 20 65 6e 74 69 72 65   scan the entire
1080: 20 69 6e 70 75 74 20 61 6e 64 20 63 6f 75 6e 74   input and count
1090: 20 74 68 65 0a 2a 2a 20 6e 75 6d 62 65 72 20 6f   the.** number o
10a0: 66 20 6f 63 63 75 72 61 6e 63 65 73 20 6f 66 20  f occurances of 
10b0: 65 61 63 68 20 63 68 61 72 61 63 74 65 72 20 76  each character v
10c0: 61 6c 75 65 20 69 6e 20 74 68 65 20 69 6e 70 75  alue in the inpu
10d0: 74 2e 20 20 53 75 70 70 6f 73 65 0a 2a 2a 20 74  t.  Suppose.** t
10e0: 68 65 20 6e 75 6d 62 65 72 20 6f 66 20 30 78 30  he number of 0x0
10f0: 30 20 63 68 61 72 61 63 74 65 72 73 20 69 73 20  0 characters is 
1100: 4e 28 30 29 2c 20 74 68 65 20 6e 75 6d 62 65 72  N(0), the number
1110: 20 6f 66 20 6f 63 63 75 72 61 6e 63 65 73 20 6f   of occurances o
1120: 66 20 30 78 30 31 0a 2a 2a 20 69 73 20 4e 28 31  f 0x01.** is N(1
1130: 29 2c 20 61 6e 64 20 73 6f 20 66 6f 72 74 68 20  ), and so forth 
1140: 75 70 20 74 6f 20 74 68 65 20 6e 75 6d 62 65 72  up to the number
1150: 20 6f 66 20 6f 63 63 75 72 61 6e 63 65 73 20 6f   of occurances o
1160: 66 20 30 78 66 66 20 69 73 20 4e 28 32 35 35 29  f 0xff is N(255)
1170: 2e 0a 2a 2a 20 41 6e 20 6f 66 66 73 65 74 20 6f  ..** An offset o
1180: 66 20 30 20 69 73 20 6e 6f 74 20 61 6c 6c 6f 77  f 0 is not allow
1190: 65 64 20 73 6f 20 77 65 20 64 6f 6e 27 74 20 68  ed so we don't h
11a0: 61 76 65 20 74 6f 20 74 65 73 74 20 69 74 2e 20  ave to test it. 
11b0: 20 54 68 65 20 6e 75 6d 62 65 72 0a 2a 2a 20 6f   The number.** o
11c0: 66 20 65 73 63 61 70 65 73 20 72 65 71 75 69 72  f escapes requir
11d0: 65 64 20 66 6f 72 20 61 6e 20 6f 66 66 73 65 74  ed for an offset
11e0: 20 6f 66 20 31 20 69 73 20 4e 28 31 29 2b 4e 28   of 1 is N(1)+N(
11f0: 32 29 2b 4e 28 34 30 29 2e 20 20 54 68 65 20 6e  2)+N(40).  The n
1200: 75 6d 62 65 72 0a 2a 2a 20 6f 66 20 65 73 63 61  umber.** of esca
1210: 70 65 73 20 72 65 71 75 69 72 65 64 20 66 6f 72  pes required for
1220: 20 61 6e 20 6f 66 66 73 65 74 20 6f 66 20 32 20   an offset of 2 
1230: 69 73 20 4e 28 32 29 2b 4e 28 33 29 2b 4e 28 34  is N(2)+N(3)+N(4
1240: 31 29 2e 20 20 41 6e 64 20 73 6f 20 66 6f 72 74  1).  And so fort
1250: 68 2e 0a 2a 2a 20 49 6e 20 74 68 69 73 20 77 61  h..** In this wa
1260: 79 20 77 65 20 66 69 6e 64 20 74 68 65 20 6f 66  y we find the of
1270: 66 73 65 74 20 74 68 61 74 20 67 69 76 65 73 20  fset that gives 
1280: 74 68 65 20 6d 69 6e 69 6d 75 6d 20 6e 75 6d 62  the minimum numb
1290: 65 72 20 6f 66 20 65 73 63 61 70 65 73 2c 0a 2a  er of escapes,.*
12a0: 2a 20 61 6e 64 20 74 68 75 73 20 6d 69 6e 69 6d  * and thus minim
12b0: 69 7a 65 73 20 74 68 65 20 6c 65 6e 67 74 68 20  izes the length 
12c0: 6f 66 20 74 68 65 20 6f 75 74 70 75 74 20 73 74  of the output st
12d0: 72 69 6e 67 2e 0a 2a 2f 0a 0a 2f 2a 0a 2a 2a 20  ring..*/../*.** 
12e0: 45 6e 63 6f 64 65 20 61 20 62 69 6e 61 72 79 20  Encode a binary 
12f0: 62 75 66 66 65 72 20 22 69 6e 22 20 6f 66 20 73  buffer "in" of s
1300: 69 7a 65 20 6e 20 62 79 74 65 73 20 73 6f 20 74  ize n bytes so t
1310: 68 61 74 20 69 74 20 63 6f 6e 74 61 69 6e 73 0a  hat it contains.
1320: 2a 2a 20 6e 6f 20 69 6e 73 74 61 6e 63 65 73 20  ** no instances 
1330: 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 27 5c  of characters '\
1340: 27 27 20 6f 72 20 27 5c 30 30 30 27 2e 20 20 54  '' or '\000'.  T
1350: 68 65 20 6f 75 74 70 75 74 20 69 73 20 0a 2a 2a  he output is .**
1360: 20 6e 75 6c 6c 2d 74 65 72 6d 69 6e 61 74 65 64   null-terminated
1370: 20 61 6e 64 20 63 61 6e 20 62 65 20 75 73 65 64   and can be used
1380: 20 61 73 20 61 20 73 74 72 69 6e 67 20 76 61 6c   as a string val
1390: 75 65 20 69 6e 20 61 6e 20 49 4e 53 45 52 54 0a  ue in an INSERT.
13a0: 2a 2a 20 6f 72 20 55 50 44 41 54 45 20 73 74 61  ** or UPDATE sta
13b0: 74 65 6d 65 6e 74 2e 20 20 55 73 65 20 73 71 6c  tement.  Use sql
13c0: 69 74 65 5f 64 65 63 6f 64 65 5f 62 69 6e 61 72  ite_decode_binar
13d0: 79 28 29 20 74 6f 20 63 6f 6e 76 65 72 74 20 74  y() to convert t
13e0: 68 65 0a 2a 2a 20 73 74 72 69 6e 67 20 62 61 63  he.** string bac
13f0: 6b 20 69 6e 74 6f 20 69 74 73 20 6f 72 69 67 69  k into its origi
1400: 6e 61 6c 20 62 69 6e 61 72 79 2e 0a 2a 2a 0a 2a  nal binary..**.*
1410: 2a 20 54 68 65 20 72 65 73 75 6c 74 20 69 73 20  * The result is 
1420: 77 72 69 74 74 65 6e 20 69 6e 74 6f 20 61 20 70  written into a p
1430: 72 65 61 6c 6c 6f 63 61 74 65 64 20 6f 75 74 70  reallocated outp
1440: 75 74 20 62 75 66 66 65 72 20 22 6f 75 74 22 2e  ut buffer "out".
1450: 0a 2a 2a 20 22 6f 75 74 22 20 6d 75 73 74 20 62  .** "out" must b
1460: 65 20 61 62 6c 65 20 74 6f 20 68 6f 6c 64 20 61  e able to hold a
1470: 74 20 6c 65 61 73 74 20 32 20 2b 28 32 35 37 2a  t least 2 +(257*
1480: 6e 29 2f 32 35 34 20 62 79 74 65 73 2e 0a 2a 2a  n)/254 bytes..**
1490: 20 49 6e 20 6f 74 68 65 72 20 77 6f 72 64 73 2c   In other words,
14a0: 20 74 68 65 20 6f 75 74 70 75 74 20 77 69 6c 6c   the output will
14b0: 20 62 65 20 65 78 70 61 6e 64 65 64 20 62 79 20   be expanded by 
14c0: 61 73 20 6d 75 63 68 20 61 73 20 33 0a 2a 2a 20  as much as 3.** 
14d0: 62 79 74 65 73 20 66 6f 72 20 65 76 65 72 79 20  bytes for every 
14e0: 32 35 34 20 62 79 74 65 73 20 6f 66 20 69 6e 70  254 bytes of inp
14f0: 75 74 20 70 6c 75 73 20 32 20 62 79 74 65 73 20  ut plus 2 bytes 
1500: 6f 66 20 66 69 78 65 64 20 6f 76 65 72 68 65 61  of fixed overhea
1510: 64 2e 0a 2a 2a 20 28 54 68 69 73 20 69 73 20 61  d..** (This is a
1520: 70 70 72 6f 78 69 6d 61 74 65 6c 79 20 32 20 2b  pproximately 2 +
1530: 20 31 2e 30 31 31 38 2a 6e 20 6f 72 20 61 62 6f   1.0118*n or abo
1540: 75 74 20 61 20 31 2e 32 25 20 73 69 7a 65 20 69  ut a 1.2% size i
1550: 6e 63 72 65 61 73 65 2e 29 0a 2a 2a 0a 2a 2a 20  ncrease.).**.** 
1560: 54 68 65 20 72 65 74 75 72 6e 20 76 61 6c 75 65  The return value
1570: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 6f   is the number o
1580: 66 20 63 68 61 72 61 63 74 65 72 73 20 69 6e 20  f characters in 
1590: 74 68 65 20 65 6e 63 6f 64 65 64 0a 2a 2a 20 73  the encoded.** s
15a0: 74 72 69 6e 67 2c 20 65 78 63 6c 75 64 69 6e 67  tring, excluding
15b0: 20 74 68 65 20 22 5c 30 30 30 22 20 74 65 72 6d   the "\000" term
15c0: 69 6e 61 74 6f 72 2e 0a 2a 2f 0a 69 6e 74 20 73  inator..*/.int s
15d0: 71 6c 69 74 65 5f 65 6e 63 6f 64 65 5f 62 69 6e  qlite_encode_bin
15e0: 61 72 79 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e  ary(const unsign
15f0: 65 64 20 63 68 61 72 20 2a 69 6e 2c 20 69 6e 74  ed char *in, int
1600: 20 6e 2c 20 75 6e 73 69 67 6e 65 64 20 63 68 61   n, unsigned cha
1610: 72 20 2a 6f 75 74 29 7b 0a 20 20 69 6e 74 20 69  r *out){.  int i
1620: 2c 20 6a 2c 20 65 2c 20 6d 3b 0a 20 20 69 6e 74  , j, e, m;.  int
1630: 20 63 6e 74 5b 32 35 36 5d 3b 0a 20 20 69 66 28   cnt[256];.  if(
1640: 20 6e 3c 3d 30 20 29 7b 0a 20 20 20 20 6f 75 74   n<=0 ){.    out
1650: 5b 30 5d 20 3d 20 27 78 27 3b 0a 20 20 20 20 6f  [0] = 'x';.    o
1660: 75 74 5b 31 5d 20 3d 20 30 3b 0a 20 20 20 20 72  ut[1] = 0;.    r
1670: 65 74 75 72 6e 20 31 3b 0a 20 20 7d 0a 20 20 6d  eturn 1;.  }.  m
1680: 65 6d 73 65 74 28 63 6e 74 2c 20 30 2c 20 73 69  emset(cnt, 0, si
1690: 7a 65 6f 66 28 63 6e 74 29 29 3b 0a 20 20 66 6f  zeof(cnt));.  fo
16a0: 72 28 69 3d 6e 2d 31 3b 20 69 3e 3d 30 3b 20 69  r(i=n-1; i>=0; i
16b0: 2d 2d 29 7b 20 63 6e 74 5b 69 6e 5b 69 5d 5d 2b  --){ cnt[in[i]]+
16c0: 2b 3b 20 7d 0a 20 20 6d 20 3d 20 6e 3b 0a 20 20  +; }.  m = n;.  
16d0: 66 6f 72 28 69 3d 31 3b 20 69 3c 32 35 36 3b 20  for(i=1; i<256; 
16e0: 69 2b 2b 29 7b 0a 20 20 20 20 69 6e 74 20 73 75  i++){.    int su
16f0: 6d 3b 0a 20 20 20 20 69 66 28 20 69 3d 3d 27 5c  m;.    if( i=='\
1700: 27 27 20 29 20 63 6f 6e 74 69 6e 75 65 3b 0a 20  '' ) continue;. 
1710: 20 20 20 73 75 6d 20 3d 20 63 6e 74 5b 69 5d 20     sum = cnt[i] 
1720: 2b 20 63 6e 74 5b 28 69 2b 31 29 26 30 78 66 66  + cnt[(i+1)&0xff
1730: 5d 20 2b 20 63 6e 74 5b 28 69 2b 27 5c 27 27 29  ] + cnt[(i+'\'')
1740: 26 30 78 66 66 5d 3b 0a 20 20 20 20 69 66 28 20  &0xff];.    if( 
1750: 73 75 6d 3c 6d 20 29 7b 0a 20 20 20 20 20 20 6d  sum<m ){.      m
1760: 20 3d 20 73 75 6d 3b 0a 20 20 20 20 20 20 65 20   = sum;.      e 
1770: 3d 20 69 3b 0a 20 20 20 20 20 20 69 66 28 20 6d  = i;.      if( m
1780: 3d 3d 30 20 29 20 62 72 65 61 6b 3b 0a 20 20 20  ==0 ) break;.   
1790: 20 7d 0a 20 20 7d 0a 20 20 6f 75 74 5b 30 5d 20   }.  }.  out[0] 
17a0: 3d 20 65 3b 0a 20 20 6a 20 3d 20 31 3b 0a 20 20  = e;.  j = 1;.  
17b0: 66 6f 72 28 69 3d 30 3b 20 69 3c 6e 3b 20 69 2b  for(i=0; i<n; i+
17c0: 2b 29 7b 0a 20 20 20 20 69 6e 74 20 63 20 3d 20  +){.    int c = 
17d0: 28 69 6e 5b 69 5d 20 2d 20 65 29 26 30 78 66 66  (in[i] - e)&0xff
17e0: 3b 0a 20 20 20 20 69 66 28 20 63 3d 3d 30 20 29  ;.    if( c==0 )
17f0: 7b 0a 20 20 20 20 20 20 6f 75 74 5b 6a 2b 2b 5d  {.      out[j++]
1800: 20 3d 20 31 3b 0a 20 20 20 20 20 20 6f 75 74 5b   = 1;.      out[
1810: 6a 2b 2b 5d 20 3d 20 31 3b 0a 20 20 20 20 7d 65  j++] = 1;.    }e
1820: 6c 73 65 20 69 66 28 20 63 3d 3d 31 20 29 7b 0a  lse if( c==1 ){.
1830: 20 20 20 20 20 20 6f 75 74 5b 6a 2b 2b 5d 20 3d        out[j++] =
1840: 20 31 3b 0a 20 20 20 20 20 20 6f 75 74 5b 6a 2b   1;.      out[j+
1850: 2b 5d 20 3d 20 32 3b 0a 20 20 20 20 7d 65 6c 73  +] = 2;.    }els
1860: 65 20 69 66 28 20 63 3d 3d 27 5c 27 27 20 29 7b  e if( c=='\'' ){
1870: 0a 20 20 20 20 20 20 6f 75 74 5b 6a 2b 2b 5d 20  .      out[j++] 
1880: 3d 20 31 3b 0a 20 20 20 20 20 20 6f 75 74 5b 6a  = 1;.      out[j
1890: 2b 2b 5d 20 3d 20 33 3b 0a 20 20 20 20 7d 65 6c  ++] = 3;.    }el
18a0: 73 65 7b 0a 20 20 20 20 20 20 6f 75 74 5b 6a 2b  se{.      out[j+
18b0: 2b 5d 20 3d 20 63 3b 0a 20 20 20 20 7d 0a 20 20  +] = c;.    }.  
18c0: 7d 0a 20 20 6f 75 74 5b 6a 5d 20 3d 20 30 3b 0a  }.  out[j] = 0;.
18d0: 20 20 72 65 74 75 72 6e 20 6a 3b 0a 7d 0a 0a 2f    return j;.}../
18e0: 2a 0a 2a 2a 20 44 65 63 6f 64 65 20 74 68 65 20  *.** Decode the 
18f0: 73 74 72 69 6e 67 20 22 69 6e 22 20 69 6e 74 6f  string "in" into
1900: 20 62 69 6e 61 72 79 20 64 61 74 61 20 61 6e 64   binary data and
1910: 20 77 72 69 74 65 20 69 74 20 69 6e 74 6f 20 22   write it into "
1920: 6f 75 74 22 2e 0a 2a 2a 20 54 68 69 73 20 72 6f  out"..** This ro
1930: 75 74 69 6e 65 20 72 65 76 65 72 73 65 73 20 74  utine reverses t
1940: 68 65 20 65 6e 63 6f 64 69 6e 67 20 63 72 65 61  he encoding crea
1950: 74 65 64 20 62 79 20 73 71 6c 69 74 65 5f 65 6e  ted by sqlite_en
1960: 63 6f 64 65 5f 62 69 6e 61 72 79 28 29 2e 0a 2a  code_binary()..*
1970: 2a 20 54 68 65 20 6f 75 74 70 75 74 20 77 69 6c  * The output wil
1980: 6c 20 61 6c 77 61 79 73 20 62 65 20 61 20 66 65  l always be a fe
1990: 77 20 62 79 74 65 73 20 6c 65 73 73 20 74 68 61  w bytes less tha
19a0: 6e 20 74 68 65 20 69 6e 70 75 74 2e 20 20 54 68  n the input.  Th
19b0: 65 20 6e 75 6d 62 65 72 0a 2a 2a 20 6f 66 20 62  e number.** of b
19c0: 79 74 65 73 20 6f 66 20 6f 75 74 70 75 74 20 69  ytes of output i
19d0: 73 20 72 65 74 75 72 6e 65 64 2e 20 20 49 66 20  s returned.  If 
19e0: 74 68 65 20 69 6e 70 75 74 20 69 73 20 6e 6f 74  the input is not
19f0: 20 61 20 77 65 6c 6c 2d 66 6f 72 6d 65 64 0a 2a   a well-formed.*
1a00: 2a 20 65 6e 63 6f 64 69 6e 67 2c 20 2d 31 20 69  * encoding, -1 i
1a10: 73 20 72 65 74 75 72 6e 65 64 2e 0a 2a 2a 0a 2a  s returned..**.*
1a20: 2a 20 54 68 65 20 22 69 6e 22 20 61 6e 64 20 22  * The "in" and "
1a30: 6f 75 74 22 20 70 61 72 61 6d 65 74 65 72 73 20  out" parameters 
1a40: 6d 61 79 20 70 6f 69 6e 74 20 74 6f 20 74 68 65  may point to the
1a50: 20 73 61 6d 65 20 62 75 66 66 65 72 20 69 6e 20   same buffer in 
1a60: 6f 72 64 65 72 0a 2a 2a 20 74 6f 20 64 65 63 6f  order.** to deco
1a70: 64 65 20 61 20 73 74 72 69 6e 67 20 69 6e 20 70  de a string in p
1a80: 6c 61 63 65 2e 0a 2a 2f 0a 69 6e 74 20 73 71 6c  lace..*/.int sql
1a90: 69 74 65 5f 64 65 63 6f 64 65 5f 62 69 6e 61 72  ite_decode_binar
1aa0: 79 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64  y(const unsigned
1ab0: 20 63 68 61 72 20 2a 69 6e 2c 20 75 6e 73 69 67   char *in, unsig
1ac0: 6e 65 64 20 63 68 61 72 20 2a 6f 75 74 29 7b 0a  ned char *out){.
1ad0: 20 20 69 6e 74 20 69 2c 20 63 2c 20 65 3b 0a 20    int i, c, e;. 
1ae0: 20 65 20 3d 20 2a 28 69 6e 2b 2b 29 3b 0a 20 20   e = *(in++);.  
1af0: 69 20 3d 20 30 3b 0a 20 20 77 68 69 6c 65 28 20  i = 0;.  while( 
1b00: 28 63 20 3d 20 2a 28 69 6e 2b 2b 29 29 21 3d 30  (c = *(in++))!=0
1b10: 20 29 7b 0a 20 20 20 20 69 66 28 20 63 3d 3d 31   ){.    if( c==1
1b20: 20 29 7b 0a 20 20 20 20 20 20 63 20 3d 20 2a 28   ){.      c = *(
1b30: 69 6e 2b 2b 29 3b 0a 20 20 20 20 20 20 69 66 28  in++);.      if(
1b40: 20 63 3d 3d 31 20 29 7b 0a 20 20 20 20 20 20 20   c==1 ){.       
1b50: 20 63 20 3d 20 30 3b 0a 20 20 20 20 20 20 7d 65   c = 0;.      }e
1b60: 6c 73 65 20 69 66 28 20 63 3d 3d 32 20 29 7b 0a  lse if( c==2 ){.
1b70: 20 20 20 20 20 20 20 20 63 20 3d 20 31 3b 0a 20          c = 1;. 
1b80: 20 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20 63       }else if( c
1b90: 3d 3d 33 20 29 7b 0a 20 20 20 20 20 20 20 20 63  ==3 ){.        c
1ba0: 20 3d 20 27 5c 27 27 3b 0a 20 20 20 20 20 20 7d   = '\'';.      }
1bb0: 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 72 65  else{.        re
1bc0: 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 7d  turn -1;.      }
1bd0: 0a 20 20 20 20 7d 0a 20 20 20 20 6f 75 74 5b 69  .    }.    out[i
1be0: 2b 2b 5d 20 3d 20 28 63 20 2b 20 65 29 26 30 78  ++] = (c + e)&0x
1bf0: 66 66 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e  ff;.  }.  return
1c00: 20 69 3b 0a 7d 0a 0a 23 69 66 64 65 66 20 45 4e   i;.}..#ifdef EN
1c10: 43 4f 44 45 52 5f 54 45 53 54 0a 23 69 6e 63 6c  CODER_TEST.#incl
1c20: 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e 0a 2f 2a  ude <stdio.h>./*
1c30: 0a 2a 2a 20 54 68 65 20 73 75 62 72 6f 75 74 69  .** The subrouti
1c40: 6e 65 73 20 61 62 6f 76 65 20 61 72 65 20 6e 6f  nes above are no
1c50: 74 20 74 65 73 74 65 64 20 62 79 20 74 68 65 20  t tested by the 
1c60: 75 73 75 61 6c 20 74 65 73 74 20 73 75 69 74 65  usual test suite
1c70: 2e 20 20 54 6f 20 74 65 73 74 0a 2a 2a 20 74 68  .  To test.** th
1c80: 65 73 65 20 72 6f 75 74 69 6e 65 73 2c 20 63 6f  ese routines, co
1c90: 6d 70 69 6c 65 20 6a 75 73 74 20 74 68 69 73 20  mpile just this 
1ca0: 6f 6e 65 20 66 69 6c 65 20 77 69 74 68 20 61 20  one file with a 
1cb0: 2d 44 45 4e 43 4f 44 45 52 5f 54 45 53 54 3d 31  -DENCODER_TEST=1
1cc0: 20 6f 70 74 69 6f 6e 0a 2a 2a 20 61 6e 64 20 72   option.** and r
1cd0: 75 6e 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a  un the result..*
1ce0: 2f 0a 69 6e 74 20 6d 61 69 6e 28 69 6e 74 20 61  /.int main(int a
1cf0: 72 67 63 2c 20 63 68 61 72 20 2a 2a 61 72 67 76  rgc, char **argv
1d00: 29 7b 0a 20 20 69 6e 74 20 69 2c 20 6a 2c 20 6e  ){.  int i, j, n
1d10: 2c 20 6d 2c 20 6e 4f 75 74 2c 20 6e 42 79 74 65  , m, nOut, nByte
1d20: 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61  ;.  unsigned cha
1d30: 72 20 69 6e 5b 33 30 30 30 30 5d 3b 0a 20 20 75  r in[30000];.  u
1d40: 6e 73 69 67 6e 65 64 20 63 68 61 72 20 6f 75 74  nsigned char out
1d50: 5b 33 33 30 30 30 5d 3b 0a 0a 20 20 6e 42 79 74  [33000];..  nByt
1d60: 65 20 3d 20 30 3b 0a 20 20 66 6f 72 28 69 3d 30  e = 0;.  for(i=0
1d70: 3b 20 69 3c 73 69 7a 65 6f 66 28 69 6e 29 3b 20  ; i<sizeof(in); 
1d80: 69 2b 2b 29 7b 0a 20 20 20 20 70 72 69 6e 74 66  i++){.    printf
1d90: 28 22 54 65 73 74 20 25 64 3a 20 22 2c 20 69 2b  ("Test %d: ", i+
1da0: 31 29 3b 0a 20 20 20 20 6e 20 3d 20 72 61 6e 64  1);.    n = rand
1db0: 28 29 20 25 20 28 69 2b 31 29 3b 0a 20 20 20 20  () % (i+1);.    
1dc0: 69 66 28 20 69 25 31 30 30 3d 3d 30 20 29 7b 0a  if( i%100==0 ){.
1dd0: 20 20 20 20 20 20 69 6e 74 20 6b 3b 0a 20 20 20        int k;.   
1de0: 20 20 20 66 6f 72 28 6a 3d 6b 3d 30 3b 20 6a 3c     for(j=k=0; j<
1df0: 6e 3b 20 6a 2b 2b 29 7b 0a 20 20 20 20 20 20 20  n; j++){.       
1e00: 20 2f 2a 20 69 66 28 20 6b 3d 3d 30 20 7c 7c 20   /* if( k==0 || 
1e10: 6b 3d 3d 27 5c 27 27 20 29 20 6b 2b 2b 3b 20 2a  k=='\'' ) k++; *
1e20: 2f 0a 20 20 20 20 20 20 20 20 69 6e 5b 6a 5d 20  /.        in[j] 
1e30: 3d 20 6b 3b 0a 20 20 20 20 20 20 20 20 6b 20 3d  = k;.        k =
1e40: 20 28 6b 2b 31 29 26 30 78 66 66 3b 0a 20 20 20   (k+1)&0xff;.   
1e50: 20 20 20 7d 0a 20 20 20 20 7d 65 6c 73 65 7b 0a     }.    }else{.
1e60: 20 20 20 20 20 20 66 6f 72 28 6a 3d 30 3b 20 6a        for(j=0; j
1e70: 3c 6e 3b 20 6a 2b 2b 29 20 69 6e 5b 6a 5d 20 3d  <n; j++) in[j] =
1e80: 20 72 61 6e 64 28 29 20 26 20 30 78 66 66 3b 0a   rand() & 0xff;.
1e90: 20 20 20 20 7d 0a 20 20 20 20 6e 42 79 74 65 20      }.    nByte 
1ea0: 2b 3d 20 6e 3b 0a 20 20 20 20 6e 4f 75 74 20 3d  += n;.    nOut =
1eb0: 20 73 71 6c 69 74 65 5f 65 6e 63 6f 64 65 5f 62   sqlite_encode_b
1ec0: 69 6e 61 72 79 28 69 6e 2c 20 6e 2c 20 6f 75 74  inary(in, n, out
1ed0: 29 3b 0a 20 20 20 20 69 66 28 20 6e 4f 75 74 21  );.    if( nOut!
1ee0: 3d 73 74 72 6c 65 6e 28 6f 75 74 29 20 29 7b 0a  =strlen(out) ){.
1ef0: 20 20 20 20 20 20 70 72 69 6e 74 66 28 22 20 45        printf(" E
1f00: 52 52 4f 52 20 72 65 74 75 72 6e 20 76 61 6c 75  RROR return valu
1f10: 65 20 69 73 20 25 64 20 69 6e 73 74 65 61 64 20  e is %d instead 
1f20: 6f 66 20 25 64 5c 6e 22 2c 20 6e 4f 75 74 2c 20  of %d\n", nOut, 
1f30: 73 74 72 6c 65 6e 28 6f 75 74 29 29 3b 0a 20 20  strlen(out));.  
1f40: 20 20 20 20 65 78 69 74 28 31 29 3b 0a 20 20 20      exit(1);.   
1f50: 20 7d 0a 20 20 20 20 6d 20 3d 20 28 32 35 36 2a   }.    m = (256*
1f60: 6e 20 2b 20 31 32 36 32 29 2f 32 35 33 3b 0a 20  n + 1262)/253;. 
1f70: 20 20 20 70 72 69 6e 74 66 28 22 73 69 7a 65 20     printf("size 
1f80: 25 64 2d 3e 25 64 20 28 6d 61 78 20 25 64 29 22  %d->%d (max %d)"
1f90: 2c 20 6e 2c 20 73 74 72 6c 65 6e 28 6f 75 74 29  , n, strlen(out)
1fa0: 2b 31 2c 20 6d 29 3b 0a 20 20 20 20 69 66 28 20  +1, m);.    if( 
1fb0: 73 74 72 6c 65 6e 28 6f 75 74 29 2b 31 3e 6d 20  strlen(out)+1>m 
1fc0: 29 7b 0a 20 20 20 20 20 20 70 72 69 6e 74 66 28  ){.      printf(
1fd0: 22 20 45 52 52 4f 52 20 6f 75 74 70 75 74 20 74  " ERROR output t
1fe0: 6f 6f 20 62 69 67 5c 6e 22 29 3b 0a 20 20 20 20  oo big\n");.    
1ff0: 20 20 65 78 69 74 28 31 29 3b 0a 20 20 20 20 7d    exit(1);.    }
2000: 0a 20 20 20 20 66 6f 72 28 6a 3d 30 3b 20 6f 75  .    for(j=0; ou
2010: 74 5b 6a 5d 3b 20 6a 2b 2b 29 7b 0a 20 20 20 20  t[j]; j++){.    
2020: 20 20 69 66 28 20 6f 75 74 5b 6a 5d 3d 3d 27 5c    if( out[j]=='\
2030: 27 27 20 29 7b 0a 20 20 20 20 20 20 20 20 70 72  '' ){.        pr
2040: 69 6e 74 66 28 22 20 45 52 52 4f 52 20 63 6f 6e  intf(" ERROR con
2050: 74 61 69 6e 73 20 28 27 29 5c 6e 22 29 3b 0a 20  tains (')\n");. 
2060: 20 20 20 20 20 20 20 65 78 69 74 28 31 29 3b 0a         exit(1);.
2070: 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a 20 20        }.    }.  
2080: 20 20 6a 20 3d 20 73 71 6c 69 74 65 5f 64 65 63    j = sqlite_dec
2090: 6f 64 65 5f 62 69 6e 61 72 79 28 6f 75 74 2c 20  ode_binary(out, 
20a0: 6f 75 74 29 3b 0a 20 20 20 20 69 66 28 20 6a 21  out);.    if( j!
20b0: 3d 6e 20 29 7b 0a 20 20 20 20 20 20 70 72 69 6e  =n ){.      prin
20c0: 74 66 28 22 20 45 52 52 4f 52 20 64 65 63 6f 64  tf(" ERROR decod
20d0: 65 20 73 69 7a 65 20 25 64 5c 6e 22 2c 20 6a 29  e size %d\n", j)
20e0: 3b 0a 20 20 20 20 20 20 65 78 69 74 28 31 29 3b  ;.      exit(1);
20f0: 0a 20 20 20 20 7d 0a 20 20 20 20 69 66 28 20 6d  .    }.    if( m
2100: 65 6d 63 6d 70 28 69 6e 2c 20 6f 75 74 2c 20 6e  emcmp(in, out, n
2110: 29 21 3d 30 20 29 7b 0a 20 20 20 20 20 20 70 72  )!=0 ){.      pr
2120: 69 6e 74 66 28 22 20 45 52 52 4f 52 20 64 65 63  intf(" ERROR dec
2130: 6f 64 65 20 6d 69 73 6d 61 74 63 68 5c 6e 22 29  ode mismatch\n")
2140: 3b 0a 20 20 20 20 20 20 65 78 69 74 28 31 29 3b  ;.      exit(1);
2150: 0a 20 20 20 20 7d 0a 20 20 20 20 70 72 69 6e 74  .    }.    print
2160: 66 28 22 20 4f 4b 5c 6e 22 29 3b 0a 20 20 7d 0a  f(" OK\n");.  }.
2170: 20 20 66 70 72 69 6e 74 66 28 73 74 64 65 72 72    fprintf(stderr
2180: 2c 20 22 46 69 6e 69 73 68 65 64 2e 20 20 54 6f  , "Finished.  To
2190: 74 61 6c 20 65 6e 63 6f 64 69 6e 67 3a 20 25 64  tal encoding: %d
21a0: 20 62 79 74 65 73 5c 6e 22 2c 20 6e 42 79 74 65   bytes\n", nByte
21b0: 29 3b 0a 7d 0a 23 65 6e 64 69 66 20 2f 2a 20 45  );.}.#endif /* E
21c0: 4e 43 4f 44 45 52 5f 54 45 53 54 20 2a 2f 0a     NCODER_TEST */.