Avoid private tokens to be white listed and allow any word character in token value (#2044)

ssteinhauser · Stefan Steinhauser · web-flow · commit 821e92e8fb6e · 2024-07-20T17:35:47.000+07:00
* fix: Avoid private tokens to be white listed Closes #2040 * feat: Allow all word characters as token value Closes #2041 --------- Co-authored-by: Stefan Steinhauser <stefan.steinhauser@arz.at>
diff --git a/src/main/java/net/sf/jsqlparser/parser/ParserKeywordsUtils.java b/src/main/java/net/sf/jsqlparser/parser/ParserKeywordsUtils.java
@@ -228,18 +228,73 @@ public static TreeSet<String> getAllKeywordsUsingRegex(File file) throws IOExcep
         Matcher tokenBlockmatcher = tokenBlockPattern.matcher(content);
         while (tokenBlockmatcher.find()) {
             String tokenBlock = tokenBlockmatcher.group(0);
-            Matcher tokenStringValueMatcher = tokenStringValuePattern.matcher(tokenBlock);
-            while (tokenStringValueMatcher.find()) {
-                String tokenValue = tokenStringValueMatcher.group(1);
-                // test if pure US-ASCII
-                if (CHARSET_ENCODER.canEncode(tokenValue) && tokenValue.matches("[A-Za-z]+")) {
-                    allKeywords.add(tokenValue);
+            // remove single and multiline comments
+            tokenBlock = tokenBlock.replaceAll("(?sm)((\\/\\*.*?\\*\\/)|(\\/\\/.*?$))", "");
+            for (String tokenDefinition : getTokenDefinitions(tokenBlock)) {
+              // check if token definition is private
+              if (tokenDefinition.matches("(?sm)^<\\s*[^#].*")) {
+                    Matcher tokenStringValueMatcher = tokenStringValuePattern.matcher(tokenDefinition);
+                    while (tokenStringValueMatcher.find()) {
+                        String tokenValue = tokenStringValueMatcher.group(1);
+                        // test if pure US-ASCII
+                        if (CHARSET_ENCODER.canEncode(tokenValue) && tokenValue.matches("\\w+")) {
+                          allKeywords.add(tokenValue);
+                        }
+                    }
                 }
             }
         }
         return allKeywords;
     }
 
+    @SuppressWarnings({"PMD.EmptyWhileStmt"})
+    private static List<String> getTokenDefinitions(String tokenBlock) {
+        List<String> tokenDefinitions = new ArrayList<>();
+        int level = 0;
+        char openChar = '<';
+        char closeChar = '>';
+        char[] tokenBlockChars = tokenBlock.toCharArray();
+        int tokenDefinitionStart = -1;
+        for (int i = 0; i < tokenBlockChars.length; ++i) {
+            if (isQuotationMark(i, tokenBlockChars)) {
+                // skip everything inside quotation marks
+                while (!isQuotationMark(++i, tokenBlockChars)) {
+                  // skip until quotation ends
+                }
+            }
+
+            char character = tokenBlockChars[i];
+            if (character == openChar) {
+                if (level == 0) {
+                    tokenDefinitionStart = i;
+                }
+
+                ++level;
+            } else if (character == closeChar) {
+                --level;
+
+                if (level == 0 && tokenDefinitionStart >= 0) {
+                    tokenDefinitions.add(tokenBlock.substring(tokenDefinitionStart, i + 1));
+                    tokenDefinitionStart = -1;
+                }
+            }
+        }
+
+        return tokenDefinitions;
+    }
+
+    private static boolean isQuotationMark(int index, char[] str) {
+        if (str[index] == '\"') {
+            // check if quotation is escaped
+            if (index > 0 && str[index - 1] == '\\') {
+                return index > 1 && str[index - 2] == '\\';
+            }
+
+            return true;
+        }
+
+        return false;
+    }
 
     public static void buildGrammarForRelObjectNameWithoutValue(File file) throws Exception {
         Pattern methodBlockPattern = Pattern.compile(
diff --git a/src/main/jjtree/net/sf/jsqlparser/parser/JSqlParserCC.jjt b/src/main/jjtree/net/sf/jsqlparser/parser/JSqlParserCC.jjt
@@ -1957,8 +1957,8 @@ The following tokens are allowed as Names for Schema, Table, Column and Aliases
 String RelObjectNameWithoutValue() :
 {    Token tk = null; }
 {
-    ( tk=<DATA_TYPE> | tk=<S_IDENTIFIER> | tk=<S_QUOTED_IDENTIFIER> |  tk=<K_DATE_LITERAL> | tk=<K_DATETIMELITERAL> | tk=<K_STRING_FUNCTION_NAME> | tk=<K_ISOLATION> | tk=<K_TIME_KEY_EXPR>
-       | tk="ACTION" | tk="ACTIVE" | tk="ADD" | tk="ADVANCE" | tk="ADVISE" | tk="AGAINST" | tk="ALGORITHM" | tk="ALTER" | tk="ANALYZE" | tk="APPLY" | tk="APPROXIMATE" | tk="ARCHIVE" | tk="ARRAY" | tk="ASC" | tk="AT" | tk="AUTHORIZATION" | tk="AUTO" | tk="BASE64" | tk="BEGIN" | tk="BERNOULLI" | tk="BINARY" | tk="BIT" | tk="BLOCK" | tk="BROWSE" | tk="BUFFERS" | tk="BY" | tk="BYTE" | tk="BYTES" | tk="CACHE" | tk="CALL" | tk="CASCADE" | tk="CASE" | tk="CAST" | tk="CHANGE" | tk="CHANGES" | tk="CHAR" | tk="CHARACTER" | tk="CHECKPOINT" | tk="CLOSE" | tk="COLLATE" | tk="COLUMN" | tk="COLUMNS" | tk="COMMENT" | tk="COMMIT" | tk="CONCURRENTLY" | tk="CONFLICT" | tk="CONSTRAINTS" | tk="CONVERT" | tk="COSTS" | tk="CS" | tk="CYCLE" | tk="DATA" | tk="DATABASE" | tk="DATETIME" | tk="DDL" | tk="DECLARE" | tk="DEFAULT" | tk="DEFERRABLE" | tk="DELAYED" | tk="DELETE" | tk="DESC" | tk="DESCRIBE" | tk="DISABLE" | tk="DISCONNECT" | tk="DIV" | tk="DML" | tk="DO" | tk="DOMAIN" | tk="DROP" | tk="DUMP" | tk="DUPLICATE" | tk="ELEMENTS" | tk="EMIT" | tk="ENABLE" | tk="END" | tk="ESCAPE" | tk="EXCLUDE" | tk="EXEC" | tk="EXECUTE" | tk="EXPLAIN" | tk="EXPLICIT" | tk="EXTENDED" | tk="EXTRACT" | tk="FALSE" | tk="FILTER" | tk="FIRST" | tk="FLUSH" | tk="FN" | tk="FOLLOWING" | tk="FORMAT" | tk="FULLTEXT" | tk="FUNCTION" | tk="GRANT" | tk="GUARD" | tk="HASH" | tk="HISTORY" | tk="HOPPING" | tk="INCLUDE" | tk="INCREMENT" | tk="INDEX" | tk="INSERT" | tk="INTERLEAVE" | tk="INTERPRET" | tk="INVALIDATE" | tk="ISNULL" | tk="JSON" | tk="KEEP" | tk="KEY" | tk="KEYS" | tk="LAST" | tk="LEADING" | tk="LINK" | tk="LOCAL" | tk="LOCKED" | tk="LOG" | tk="LOOP" | tk="MATCH" | tk="MATCHED" | tk="MATERIALIZED" | tk="MAX" | tk="MAXVALUE" | tk="MEMBER" | tk="MERGE" | tk="MIN" | tk="MINVALUE" | tk="MODIFY" | tk="MOVEMENT" | tk="NEXT" | tk="NO" | tk="NOCACHE" | tk="NOKEEP" | tk="NOLOCK" | tk="NOMAXVALUE" | tk="NOMINVALUE" | tk="NOORDER" | tk="NOTHING" | tk="NOTNULL" | tk="NOVALIDATE" | tk="NOWAIT" | tk="NULLS" | tk="OF" | tk="OFF" | tk="OPEN" | tk="OVER" | tk="OVERLAPS" | tk="PARALLEL" | tk="PARENT" | tk="PARTITION" | tk="PATH" | tk="PERCENT" | tk="PLACING" | tk="PRECEDING" | tk="PRECISION" | tk="PRIMARY" | tk="PRIOR" | tk="PURGE" | tk="QUERY" | tk="QUICK" | tk="QUIESCE" | tk="RANGE" | tk="RAW" | tk="READ" | tk="RECURSIVE" | tk="RECYCLEBIN" | tk="REFERENCES" | tk="REFRESH" | tk="REGEXP" | tk="REGISTER" | tk="REMOTE" | tk="RENAME" | tk="REPEATABLE" | tk="REPLACE" | tk="RESET" | tk="RESPECT" | tk="RESTART" | tk="RESTRICT" | tk="RESTRICTED" | tk="RESUMABLE" | tk="RESUME" | tk="RETURN" | tk="RLIKE" | tk="ROLLBACK" | tk="ROLLUP" | tk="ROOT" | tk="ROW" | tk="ROWS" | tk="RR" | tk="RS" | tk="SAVEPOINT" | tk="SCHEMA" | tk="SECURE" | tk="SEED" | tk="SEPARATOR" | tk="SEQUENCE" | tk="SESSION" | tk="SETS" | tk="SHARE" | tk="SHOW" | tk="SHUTDOWN" | tk="SIBLINGS" | tk="SIGNED" | tk="SIMILAR" | tk="SIZE" | tk="SKIP" | tk="STORED" | tk="STRING" | tk="STRUCT" | tk="SUSPEND" | tk="SWITCH" | tk="SYNONYM" | tk="SYSTEM" | tk="TABLE" | tk="TABLESPACE" | tk="TEMP" | tk="TEMPORARY" | tk="THEN" | tk="TIMEOUT" | tk="TIMESTAMPTZ" | tk="TIMEZONE" | tk="TO" | tk="TRIGGER" | tk="TRUE" | tk="TRUNCATE" | tk="TUMBLING" | tk="TYPE" | tk="UNLOGGED" | tk="UNQIESCE" | tk="UNSIGNED" | tk="UPDATE" | tk="UPSERT" | tk="UR" | tk="USER" | tk="VALIDATE" | tk="VERBOSE" | tk="VIEW" | tk="VOLATILE" | tk="WAIT" | tk="WITHIN" | tk="WITHOUT" | tk="WORK" | tk="XML" | tk="XMLAGG" | tk="XMLDATA" | tk="XMLSCHEMA" | tk="XMLTEXT" | tk="XSINIL" | tk="YAML" | tk="YES" | tk="ZONE" )
+    ( tk=<DATA_TYPE> | tk=<S_IDENTIFIER> | tk=<S_QUOTED_IDENTIFIER> |  tk=<K_DATE_LITERAL> | tk=<K_DATETIMELITERAL> | tk=<K_STRING_FUNCTION_NAME> | tk=<K_ISOLATION> | tk=<K_TIME_KEY_EXPR> 
+       | tk="ACTION" | tk="ACTIVE" | tk="ADD" | tk="ADVANCE" | tk="ADVISE" | tk="AGAINST" | tk="ALGORITHM" | tk="ALTER" | tk="ANALYZE" | tk="APPLY" | tk="APPROXIMATE" | tk="ARCHIVE" | tk="ARRAY" | tk="ASC" | tk="AT" | tk="AUTHORIZATION" | tk="AUTO" | tk="BASE64" | tk="BEGIN" | tk="BERNOULLI" | tk="BINARY" | tk="BIT" | tk="BLOCK" | tk="BROWSE" | tk="BUFFERS" | tk="BY" | tk="BYTE" | tk="BYTES" | tk="CACHE" | tk="CALL" | tk="CASCADE" | tk="CASE" | tk="CAST" | tk="CHANGE" | tk="CHANGES" | tk="CHAR" | tk="CHARACTER" | tk="CHECKPOINT" | tk="CLOSE" | tk="COLLATE" | tk="COLUMN" | tk="COLUMNS" | tk="COMMENT" | tk="COMMIT" | tk="CONCURRENTLY" | tk="CONFLICT" | tk="CONSTRAINTS" | tk="CONVERT" | tk="COSTS" | tk="CS" | tk="CYCLE" | tk="DATA" | tk="DATABASE" | tk="DATETIME" | tk="DBA_RECYCLEBIN" | tk="DDL" | tk="DECLARE" | tk="DEFAULT" | tk="DEFERRABLE" | tk="DELAYED" | tk="DELETE" | tk="DESC" | tk="DESCRIBE" | tk="DISABLE" | tk="DISCONNECT" | tk="DIV" | tk="DML" | tk="DO" | tk="DOMAIN" | tk="DROP" | tk="DUMP" | tk="DUPLICATE" | tk="ELEMENTS" | tk="EMIT" | tk="ENABLE" | tk="END" | tk="ESCAPE" | tk="EXCLUDE" | tk="EXEC" | tk="EXECUTE" | tk="EXPLAIN" | tk="EXPLICIT" | tk="EXTENDED" | tk="EXTRACT" | tk="FALSE" | tk="FILTER" | tk="FIRST" | tk="FLUSH" | tk="FN" | tk="FOLLOWING" | tk="FORMAT" | tk="FULLTEXT" | tk="FUNCTION" | tk="GRANT" | tk="GROUP_CONCAT" | tk="GUARD" | tk="HASH" | tk="HIGH_PRIORITY" | tk="HISTORY" | tk="HOPPING" | tk="INCLUDE" | tk="INCLUDE_NULL_VALUES" | tk="INCREMENT" | tk="INDEX" | tk="INSERT" | tk="INTERLEAVE" | tk="INTERPRET" | tk="INVALIDATE" | tk="ISNULL" | tk="JSON" | tk="JSON_ARRAY" | tk="JSON_ARRAYAGG" | tk="JSON_OBJECT" | tk="JSON_OBJECTAGG" | tk="KEEP" | tk="KEY" | tk="KEYS" | tk="LAST" | tk="LEADING" | tk="LINK" | tk="LOCAL" | tk="LOCKED" | tk="LOG" | tk="LOOP" | tk="LOW_PRIORITY" | tk="MATCH" | tk="MATCHED" | tk="MATERIALIZED" | tk="MAX" | tk="MAXVALUE" | tk="MEMBER" | tk="MERGE" | tk="MIN" | tk="MINVALUE" | tk="MODIFY" | tk="MOVEMENT" | tk="NEXT" | tk="NO" | tk="NOCACHE" | tk="NOKEEP" | tk="NOLOCK" | tk="NOMAXVALUE" | tk="NOMINVALUE" | tk="NOORDER" | tk="NOTHING" | tk="NOTNULL" | tk="NOVALIDATE" | tk="NOWAIT" | tk="NULLS" | tk="OF" | tk="OFF" | tk="OPEN" | tk="OVER" | tk="OVERLAPS" | tk="PARALLEL" | tk="PARENT" | tk="PARTITION" | tk="PATH" | tk="PERCENT" | tk="PLACING" | tk="PRECEDING" | tk="PRIMARY" | tk="PRIOR" | tk="PURGE" | tk="QUERY" | tk="QUICK" | tk="QUIESCE" | tk="RANGE" | tk="RAW" | tk="READ" | tk="RECURSIVE" | tk="RECYCLEBIN" | tk="REFERENCES" | tk="REFRESH" | tk="REGEXP" | tk="REGISTER" | tk="REMOTE" | tk="RENAME" | tk="REPEATABLE" | tk="REPLACE" | tk="RESET" | tk="RESPECT" | tk="RESTART" | tk="RESTRICT" | tk="RESTRICTED" | tk="RESUMABLE" | tk="RESUME" | tk="RETURN" | tk="RLIKE" | tk="ROLLBACK" | tk="ROLLUP" | tk="ROOT" | tk="ROW" | tk="ROWS" | tk="RR" | tk="RS" | tk="SAFE_CAST" | tk="SAVEPOINT" | tk="SCHEMA" | tk="SECURE" | tk="SEED" | tk="SEPARATOR" | tk="SEQUENCE" | tk="SESSION" | tk="SETS" | tk="SHARE" | tk="SHOW" | tk="SHUTDOWN" | tk="SIBLINGS" | tk="SIGNED" | tk="SIMILAR" | tk="SIZE" | tk="SKIP" | tk="STORED" | tk="STRING" | tk="STRUCT" | tk="SUSPEND" | tk="SWITCH" | tk="SYNONYM" | tk="SYSTEM" | tk="TABLE" | tk="TABLESPACE" | tk="TEMP" | tk="TEMPORARY" | tk="THEN" | tk="TIMEOUT" | tk="TIMESTAMPTZ" | tk="TIMEZONE" | tk="TO" | tk="TRIGGER" | tk="TRUE" | tk="TRUNCATE" | tk="TRY_CAST" | tk="TUMBLING" | tk="TYPE" | tk="UNLOGGED" | tk="UNQIESCE" | tk="UNSIGNED" | tk="UPDATE" | tk="UPSERT" | tk="UR" | tk="USER" | tk="VALIDATE" | tk="VERBOSE" | tk="VIEW" | tk="VOLATILE" | tk="WAIT" | tk="WITHIN" | tk="WITHOUT" | tk="WITHOUT_ARRAY_WRAPPER" | tk="WORK" | tk="XML" | tk="XMLAGG" | tk="XMLDATA" | tk="XMLSCHEMA" | tk="XMLTEXT" | tk="XSINIL" | tk="YAML" | tk="YES" | tk="ZONE" )
     { return tk.image; }
 }
 
diff --git a/src/test/java/net/sf/jsqlparser/parser/ParserKeywordsUtilsTest.java b/src/test/java/net/sf/jsqlparser/parser/ParserKeywordsUtilsTest.java
@@ -52,7 +52,7 @@ class ParserKeywordsUtilsTest {
 
 
     private static void addTokenImage(TreeSet<String> allKeywords, RStringLiteral literal) {
-        if (CHARSET_ENCODER.canEncode(literal.image) && literal.image.matches("[A-Za-z]+")) {
+        if (CHARSET_ENCODER.canEncode(literal.image) && literal.image.matches("\\w+")) {
             allKeywords.add(literal.image);
         }
     }

Original file line number	Diff line number	Diff line change
`@@ -1957,8 +1957,8 @@ The following tokens are allowed as Names for Schema, Table, Column and Aliases`
`1957`	`1957`	`String RelObjectNameWithoutValue() :`
`1958`	`1958`	`{ Token tk = null; }`
`1959`	`1959`	`{`
`1960`		`- ( tk=<DATA_TYPE> \| tk=<S_IDENTIFIER> \| tk=<S_QUOTED_IDENTIFIER> \| tk=<K_DATE_LITERAL> \| tk=<K_DATETIMELITERAL> \| tk=<K_STRING_FUNCTION_NAME> \| tk=<K_ISOLATION> \| tk=<K_TIME_KEY_EXPR>`
`1961`		- \| tk="ACTION" \| tk="ACTIVE" \| tk="ADD" \| tk="ADVANCE" \| tk="ADVISE" \| tk="AGAINST" \| tk="ALGORITHM" \| tk="ALTER" \| tk="ANALYZE" \| tk="APPLY" \| tk="APPROXIMATE" \| tk="ARCHIVE" \| tk="ARRAY" \| tk="ASC" \| tk="AT" \| tk="AUTHORIZATION" \| tk="AUTO" \| tk="BASE64" \| tk="BEGIN" \| tk="BERNOULLI" \| tk="BINARY" \| tk="BIT" \| tk="BLOCK" \| tk="BROWSE" \| tk="BUFFERS" \| tk="BY" \| tk="BYTE" \| tk="BYTES" \| tk="CACHE" \| tk="CALL" \| tk="CASCADE" \| tk="CASE" \| tk="CAST" \| tk="CHANGE" \| tk="CHANGES" \| tk="CHAR" \| tk="CHARACTER" \| tk="CHECKPOINT" \| tk="CLOSE" \| tk="COLLATE" \| tk="COLUMN" \| tk="COLUMNS" \| tk="COMMENT" \| tk="COMMIT" \| tk="CONCURRENTLY" \| tk="CONFLICT" \| tk="CONSTRAINTS" \| tk="CONVERT" \| tk="COSTS" \| tk="CS" \| tk="CYCLE" \| tk="DATA" \| tk="DATABASE" \| tk="DATETIME" \| tk="DDL" \| tk="DECLARE" \| tk="DEFAULT" \| tk="DEFERRABLE" \| tk="DELAYED" \| tk="DELETE" \| tk="DESC" \| tk="DESCRIBE" \| tk="DISABLE" \| tk="DISCONNECT" \| tk="DIV" \| tk="DML" \| tk="DO" \| tk="DOMAIN" \| tk="DROP" \| tk="DUMP" \| tk="DUPLICATE" \| tk="ELEMENTS" \| tk="EMIT" \| tk="ENABLE" \| tk="END" \| tk="ESCAPE" \| tk="EXCLUDE" \| tk="EXEC" \| tk="EXECUTE" \| tk="EXPLAIN" \| tk="EXPLICIT" \| tk="EXTENDED" \| tk="EXTRACT" \| tk="FALSE" \| tk="FILTER" \| tk="FIRST" \| tk="FLUSH" \| tk="FN" \| tk="FOLLOWING" \| tk="FORMAT" \| tk="FULLTEXT" \| tk="FUNCTION" \| tk="GRANT" \| tk="GUARD" \| tk="HASH" \| tk="HISTORY" \| tk="HOPPING" \| tk="INCLUDE" \| tk="INCREMENT" \| tk="INDEX" \| tk="INSERT" \| tk="INTERLEAVE" \| tk="INTERPRET" \| tk="INVALIDATE" \| tk="ISNULL" \| tk="JSON" \| tk="KEEP" \| tk="KEY" \| tk="KEYS" \| tk="LAST" \| tk="LEADING" \| tk="LINK" \| tk="LOCAL" \| tk="LOCKED" \| tk="LOG" \| tk="LOOP" \| tk="MATCH" \| tk="MATCHED" \| tk="MATERIALIZED" \| tk="MAX" \| tk="MAXVALUE" \| tk="MEMBER" \| tk="MERGE" \| tk="MIN" \| tk="MINVALUE" \| tk="MODIFY" \| tk="MOVEMENT" \| tk="NEXT" \| tk="NO" \| tk="NOCACHE" \| tk="NOKEEP" \| tk="NOLOCK" \| tk="NOMAXVALUE" \| tk="NOMINVALUE" \| tk="NOORDER" \| tk="NOTHING" \| tk="NOTNULL" \| tk="NOVALIDATE" \| tk="NOWAIT" \| tk="NULLS" \| tk="OF" \| tk="OFF" \| tk="OPEN" \| tk="OVER" \| tk="OVERLAPS" \| tk="PARALLEL" \| tk="PARENT" \| tk="PARTITION" \| tk="PATH" \| tk="PERCENT" \| tk="PLACING" \| tk="PRECEDING" \| tk="PRECISION" \| tk="PRIMARY" \| tk="PRIOR" \| tk="PURGE" \| tk="QUERY" \| tk="QUICK" \| tk="QUIESCE" \| tk="RANGE" \| tk="RAW" \| tk="READ" \| tk="RECURSIVE" \| tk="RECYCLEBIN" \| tk="REFERENCES" \| tk="REFRESH" \| tk="REGEXP" \| tk="REGISTER" \| tk="REMOTE" \| tk="RENAME" \| tk="REPEATABLE" \| tk="REPLACE" \| tk="RESET" \| tk="RESPECT" \| tk="RESTART" \| tk="RESTRICT" \| tk="RESTRICTED" \| tk="RESUMABLE" \| tk="RESUME" \| tk="RETURN" \| tk="RLIKE" \| tk="ROLLBACK" \| tk="ROLLUP" \| tk="ROOT" \| tk="ROW" \| tk="ROWS" \| tk="RR" \| tk="RS" \| tk="SAVEPOINT" \| tk="SCHEMA" \| tk="SECURE" \| tk="SEED" \| tk="SEPARATOR" \| tk="SEQUENCE" \| tk="SESSION" \| tk="SETS" \| tk="SHARE" \| tk="SHOW" \| tk="SHUTDOWN" \| tk="SIBLINGS" \| tk="SIGNED" \| tk="SIMILAR" \| tk="SIZE" \| tk="SKIP" \| tk="STORED" \| tk="STRING" \| tk="STRUCT" \| tk="SUSPEND" \| tk="SWITCH" \| tk="SYNONYM" \| tk="SYSTEM" \| tk="TABLE" \| tk="TABLESPACE" \| tk="TEMP" \| tk="TEMPORARY" \| tk="THEN" \| tk="TIMEOUT" \| tk="TIMESTAMPTZ" \| tk="TIMEZONE" \| tk="TO" \| tk="TRIGGER" \| tk="TRUE" \| tk="TRUNCATE" \| tk="TUMBLING" \| tk="TYPE" \| tk="UNLOGGED" \| tk="UNQIESCE" \| tk="UNSIGNED" \| tk="UPDATE" \| tk="UPSERT" \| tk="UR" \| tk="USER" \| tk="VALIDATE" \| tk="VERBOSE" \| tk="VIEW" \| tk="VOLATILE" \| tk="WAIT" \| tk="WITHIN" \| tk="WITHOUT" \| tk="WORK" \| tk="XML" \| tk="XMLAGG" \| tk="XMLDATA" \| tk="XMLSCHEMA" \| tk="XMLTEXT" \| tk="XSINIL" \| tk="YAML" \| tk="YES" \| tk="ZONE" )
	`1960`	`+ ( tk=<DATA_TYPE> \| tk=<S_IDENTIFIER> \| tk=<S_QUOTED_IDENTIFIER> \| tk=<K_DATE_LITERAL> \| tk=<K_DATETIMELITERAL> \| tk=<K_STRING_FUNCTION_NAME> \| tk=<K_ISOLATION> \| tk=<K_TIME_KEY_EXPR>`
	`1961`	+ \| tk="ACTION" \| tk="ACTIVE" \| tk="ADD" \| tk="ADVANCE" \| tk="ADVISE" \| tk="AGAINST" \| tk="ALGORITHM" \| tk="ALTER" \| tk="ANALYZE" \| tk="APPLY" \| tk="APPROXIMATE" \| tk="ARCHIVE" \| tk="ARRAY" \| tk="ASC" \| tk="AT" \| tk="AUTHORIZATION" \| tk="AUTO" \| tk="BASE64" \| tk="BEGIN" \| tk="BERNOULLI" \| tk="BINARY" \| tk="BIT" \| tk="BLOCK" \| tk="BROWSE" \| tk="BUFFERS" \| tk="BY" \| tk="BYTE" \| tk="BYTES" \| tk="CACHE" \| tk="CALL" \| tk="CASCADE" \| tk="CASE" \| tk="CAST" \| tk="CHANGE" \| tk="CHANGES" \| tk="CHAR" \| tk="CHARACTER" \| tk="CHECKPOINT" \| tk="CLOSE" \| tk="COLLATE" \| tk="COLUMN" \| tk="COLUMNS" \| tk="COMMENT" \| tk="COMMIT" \| tk="CONCURRENTLY" \| tk="CONFLICT" \| tk="CONSTRAINTS" \| tk="CONVERT" \| tk="COSTS" \| tk="CS" \| tk="CYCLE" \| tk="DATA" \| tk="DATABASE" \| tk="DATETIME" \| tk="DBA_RECYCLEBIN" \| tk="DDL" \| tk="DECLARE" \| tk="DEFAULT" \| tk="DEFERRABLE" \| tk="DELAYED" \| tk="DELETE" \| tk="DESC" \| tk="DESCRIBE" \| tk="DISABLE" \| tk="DISCONNECT" \| tk="DIV" \| tk="DML" \| tk="DO" \| tk="DOMAIN" \| tk="DROP" \| tk="DUMP" \| tk="DUPLICATE" \| tk="ELEMENTS" \| tk="EMIT" \| tk="ENABLE" \| tk="END" \| tk="ESCAPE" \| tk="EXCLUDE" \| tk="EXEC" \| tk="EXECUTE" \| tk="EXPLAIN" \| tk="EXPLICIT" \| tk="EXTENDED" \| tk="EXTRACT" \| tk="FALSE" \| tk="FILTER" \| tk="FIRST" \| tk="FLUSH" \| tk="FN" \| tk="FOLLOWING" \| tk="FORMAT" \| tk="FULLTEXT" \| tk="FUNCTION" \| tk="GRANT" \| tk="GROUP_CONCAT" \| tk="GUARD" \| tk="HASH" \| tk="HIGH_PRIORITY" \| tk="HISTORY" \| tk="HOPPING" \| tk="INCLUDE" \| tk="INCLUDE_NULL_VALUES" \| tk="INCREMENT" \| tk="INDEX" \| tk="INSERT" \| tk="INTERLEAVE" \| tk="INTERPRET" \| tk="INVALIDATE" \| tk="ISNULL" \| tk="JSON" \| tk="JSON_ARRAY" \| tk="JSON_ARRAYAGG" \| tk="JSON_OBJECT" \| tk="JSON_OBJECTAGG" \| tk="KEEP" \| tk="KEY" \| tk="KEYS" \| tk="LAST" \| tk="LEADING" \| tk="LINK" \| tk="LOCAL" \| tk="LOCKED" \| tk="LOG" \| tk="LOOP" \| tk="LOW_PRIORITY" \| tk="MATCH" \| tk="MATCHED" \| tk="MATERIALIZED" \| tk="MAX" \| tk="MAXVALUE" \| tk="MEMBER" \| tk="MERGE" \| tk="MIN" \| tk="MINVALUE" \| tk="MODIFY" \| tk="MOVEMENT" \| tk="NEXT" \| tk="NO" \| tk="NOCACHE" \| tk="NOKEEP" \| tk="NOLOCK" \| tk="NOMAXVALUE" \| tk="NOMINVALUE" \| tk="NOORDER" \| tk="NOTHING" \| tk="NOTNULL" \| tk="NOVALIDATE" \| tk="NOWAIT" \| tk="NULLS" \| tk="OF" \| tk="OFF" \| tk="OPEN" \| tk="OVER" \| tk="OVERLAPS" \| tk="PARALLEL" \| tk="PARENT" \| tk="PARTITION" \| tk="PATH" \| tk="PERCENT" \| tk="PLACING" \| tk="PRECEDING" \| tk="PRIMARY" \| tk="PRIOR" \| tk="PURGE" \| tk="QUERY" \| tk="QUICK" \| tk="QUIESCE" \| tk="RANGE" \| tk="RAW" \| tk="READ" \| tk="RECURSIVE" \| tk="RECYCLEBIN" \| tk="REFERENCES" \| tk="REFRESH" \| tk="REGEXP" \| tk="REGISTER" \| tk="REMOTE" \| tk="RENAME" \| tk="REPEATABLE" \| tk="REPLACE" \| tk="RESET" \| tk="RESPECT" \| tk="RESTART" \| tk="RESTRICT" \| tk="RESTRICTED" \| tk="RESUMABLE" \| tk="RESUME" \| tk="RETURN" \| tk="RLIKE" \| tk="ROLLBACK" \| tk="ROLLUP" \| tk="ROOT" \| tk="ROW" \| tk="ROWS" \| tk="RR" \| tk="RS" \| tk="SAFE_CAST" \| tk="SAVEPOINT" \| tk="SCHEMA" \| tk="SECURE" \| tk="SEED" \| tk="SEPARATOR" \| tk="SEQUENCE" \| tk="SESSION" \| tk="SETS" \| tk="SHARE" \| tk="SHOW" \| tk="SHUTDOWN" \| tk="SIBLINGS" \| tk="SIGNED" \| tk="SIMILAR" \| tk="SIZE" \| tk="SKIP" \| tk="STORED" \| tk="STRING" \| tk="STRUCT" \| tk="SUSPEND" \| tk="SWITCH" \| tk="SYNONYM" \| tk="SYSTEM" \| tk="TABLE" \| tk="TABLESPACE" \| tk="TEMP" \| tk="TEMPORARY" \| tk="THEN" \| tk="TIMEOUT" \| tk="TIMESTAMPTZ" \| tk="TIMEZONE" \| tk="TO" \| tk="TRIGGER" \| tk="TRUE" \| tk="TRUNCATE" \| tk="TRY_CAST" \| tk="TUMBLING" \| tk="TYPE" \| tk="UNLOGGED" \| tk="UNQIESCE" \| tk="UNSIGNED" \| tk="UPDATE" \| tk="UPSERT" \| tk="UR" \| tk="USER" \| tk="VALIDATE" \| tk="VERBOSE" \| tk="VIEW" \| tk="VOLATILE" \| tk="WAIT" \| tk="WITHIN" \| tk="WITHOUT" \| tk="WITHOUT_ARRAY_WRAPPER" \| tk="WORK" \| tk="XML" \| tk="XMLAGG" \| tk="XMLDATA" \| tk="XMLSCHEMA" \| tk="XMLTEXT" \| tk="XSINIL" \| tk="YAML" \| tk="YES" \| tk="ZONE" )
`1962`	`1962`	`{ return tk.image; }`
`1963`	`1963`	`}`
`1964`	`1964`
Original file line number	Diff line number	Diff line change
`@@ -52,7 +52,7 @@ class ParserKeywordsUtilsTest {`
`52`	`52`
`53`	`53`
`54`	`54`	`private static void addTokenImage(TreeSet<String> allKeywords, RStringLiteral literal) {`
`55`		`- if (CHARSET_ENCODER.canEncode(literal.image) && literal.image.matches("[A-Za-z]+")) {`
	`55`	`+ if (CHARSET_ENCODER.canEncode(literal.image) && literal.image.matches("\\w+")) {`
`56`	`56`	`allKeywords.add(literal.image);`
`57`	`57`	`}`
`58`	`58`	`}`