원본 : http://dev.mysql.com/doc/refman/5.0/en/procedure-analyse.html

8.8.2. Using PROCEDURE ANALYSE

ANALYSE([max_elements[,max_memory]])

ANALYSE() examines the result from a query and returns an analysis of the results that suggests optimal data types for each column that may help reduce table sizes. To obtain this analysis, append PROCEDURE ANALYSE to the end of a SELECT statement:

SELECT ... FROM ... WHERE ... PROCEDURE ANALYSE([max_elements,[max_memory]])

For example:

SELECT col1, col2 FROM table1 PROCEDURE ANALYSE(10, 2000);

The results show some statistics for the values returned by the query, and propose an optimal data type for the columns. This can be helpful for checking your existing tables, or after importing new data. You may need to try different settings for the arguments so that PROCEDURE ANALYSE() does not suggest the ENUM data type when it is not appropriate.

The arguments are optional and are used as follows:

  • max_elements (default 256) is the maximum number of distinct values that ANALYSE() notices per column. This is used by ANALYSE() to check whether the optimal data type should be of type ENUM; if there are more than max_elements distinct values, then ENUM is not a suggested type.

  • max_memory (default 8192) is the maximum amount of memory that ANALYSE() should allocate per column while trying to find all distinct values.

 

처음 DB를 구성해서 일정기간 사용하다보면 특정 테이블에 데이터가 편중되고, 그러다 보면 해당 테이블 때문에 병목현상이 발생하는 경우가 종종 있다. 그때부터 해당 테이블을 어떻게 커스터마이징 해야할까 고민하게 되고 각 컬럼이 제대로 사용되는지 체크해보고 싶은 욕구가 생긴다. 가령 VARCHAR(100) 으로 선언했음에도 불구하고  실제 데이터는 20 byte 미만으로 사용된다면 해당 컬럼의 선언은 굳이 varchar(100) 이 아니라 varchar(20)으로 하는것이 좋다는 것은 누구나 아는 사실이다.

이를 분석하기 위한 방법이 바로 PROCEDURE ANALYSE 이다.