class Ripper
Ripper 是一个 Ruby 脚本解析器。
您可以通过事件驱动的方式从解析器获取信息。例如抽象语法树或 Ruby 程序的简单词法分析。
用法
Ripper 提供了一个简单的接口,可以将您的程序解析为符号表达式树(或 S 表达式)。
理解解析器的输出可能具有挑战性,建议使用 PP 来格式化输出,以便于阅读。
require 'ripper'
require 'pp'
pp Ripper.sexp('def hello(world) "Hello, #{world}!"; end')
#=> [:program,
[[:def,
[:@ident, "hello", [1, 4]],
[:paren,
[:params, [[:@ident, "world", [1, 10]]], nil, nil, nil, nil, nil, nil]],
[:bodystmt,
[[:string_literal,
[:string_content,
[:@tstring_content, "Hello, ", [1, 18]],
[:string_embexpr, [[:var_ref, [:@ident, "world", [1, 27]]]]],
[:@tstring_content, "!", [1, 33]]]]],
nil,
nil,
nil]]]]
您可以在上面的示例中看到,表达式以 :program 开头。
从这里开始,方法定义在 :def,后跟方法的标识符 :@ident。在方法标识符之后是括号 :paren 和参数下的 :params。
接下来是方法体,从 :bodystmt 开始(stmt 表示语句),其中包含方法的完整定义。
在本例中,我们只是返回一个 String,所以接下来我们有一个 :string_literal 表达式。
在我们的 :string_literal 中,您会注意到两个 @tstring_content,这是字面量部分,分别对应 Hello, 和 !。两个 @tstring_content 语句之间是一个 :string_embexpr,其中 *embexpr* 是嵌入的表达式。我们的表达式由一个局部变量组成,或者说是一个 var_ref,其标识符(@ident)是 world。
资源
要求
-
ruby 1.9(仅支持 CVS HEAD)
-
bison 1.28 或更高版本(其他 yacc 不起作用)
许可证
Ruby 许可证。
-
Minero Aoki
-
aamine@loveruby.net
Constants
- 事件
-
这个数组包含所有 ripper 事件的名称。
- PARSER_EVENTS
-
这个数组包含解析器事件的名称。
- SCANNER_EVENTS
-
这个数组包含扫描器事件的名称。
Public Class Methods
Source
# File ext/ripper/lib/ripper/lexer.rb, line 51 def Ripper.lex(src, filename = '-', lineno = 1, **kw) Lexer.new(src, filename, lineno).lex(**kw) end
对 Ruby 程序进行分词,并返回一个数组的数组,格式为 [[lineno, column], type, token, state]。filename 参数基本上被忽略。默认情况下,此方法不处理 src 中的语法错误,使用 raise_errors 关键字为 src 中的错误引发 SyntaxError。
require 'ripper'
require 'pp'
pp Ripper.lex("def m(a) nil end")
#=> [[[1, 0], :on_kw, "def", FNAME ],
[[1, 3], :on_sp, " ", FNAME ],
[[1, 4], :on_ident, "m", ENDFN ],
[[1, 5], :on_lparen, "(", BEG|LABEL],
[[1, 6], :on_ident, "a", ARG ],
[[1, 7], :on_rparen, ")", ENDFN ],
[[1, 8], :on_sp, " ", BEG ],
[[1, 9], :on_kw, "nil", END ],
[[1, 12], :on_sp, " ", END ],
[[1, 13], :on_kw, "end", END ]]
Source
# File ext/ripper/lib/ripper/core.rb, line 18 def Ripper.parse(src, filename = '(ripper)', lineno = 1) new(src, filename, lineno).parse end
Source
# File ext/ripper/lib/ripper/sexp.rb, line 35 def Ripper.sexp(src, filename = '-', lineno = 1, raise_errors: false) builder = SexpBuilderPP.new(src, filename, lineno) sexp = builder.parse if builder.error? if raise_errors raise SyntaxError, builder.error end else sexp end end
- 实验性的
-
解析
src并创建 S 表达式树。与Ripper.sexp_raw相比,此方法返回的树更易读。此方法主要供开发人员使用。filename参数基本上被忽略。默认情况下,此方法不处理src中的语法错误,在这种情况下返回nil。使用raise_errors关键字为src中的错误引发SyntaxError。require 'ripper' require 'pp' pp Ripper.sexp("def m(a) nil end") #=> [:program, [[:def, [:@ident, "m", [1, 4]], [:paren, [:params, [[:@ident, "a", [1, 6]]], nil, nil, nil, nil, nil, nil]], [:bodystmt, [[:var_ref, [:@kw, "nil", [1, 9]]]], nil, nil, nil]]]]
Source
# File ext/ripper/lib/ripper/sexp.rb, line 71 def Ripper.sexp_raw(src, filename = '-', lineno = 1, raise_errors: false) builder = SexpBuilder.new(src, filename, lineno) sexp = builder.parse if builder.error? if raise_errors raise SyntaxError, builder.error end else sexp end end
- 实验性的
-
解析
src并创建 S 表达式树。此方法主要供开发人员使用。filename参数基本上被忽略。默认情况下,此方法不处理src中的语法错误,在这种情况下返回nil。使用raise_errors关键字为src中的错误引发SyntaxError。require 'ripper' require 'pp' pp Ripper.sexp_raw("def m(a) nil end") #=> [:program, [:stmts_add, [:stmts_new], [:def, [:@ident, "m", [1, 4]], [:paren, [:params, [[:@ident, "a", [1, 6]]], nil, nil, nil]], [:bodystmt, [:stmts_add, [:stmts_new], [:var_ref, [:@kw, "nil", [1, 9]]]], nil, nil, nil]]]]
Source
# File ext/ripper/lib/ripper/lexer.rb, line 277 def Ripper.slice(src, pattern, n = 0) if m = token_match(src, pattern) then m.string(n) else nil end end
- 实验性的
-
解析
src并返回与pattern匹配的字符串。pattern应描述为Regexp。require 'ripper' p Ripper.slice('def m(a) nil end', 'ident') #=> "m" p Ripper.slice('def m(a) nil end', '[ident lparen rparen]+') #=> "m(a)" p Ripper.slice("<<EOS\nstring\nEOS", 'heredoc_beg nl $(tstring_content*) heredoc_end', 1) #=> "string\n"
Source
# File ext/ripper/lib/ripper/lexer.rb, line 25 def Ripper.tokenize(src, filename = '-', lineno = 1, **kw) Lexer.new(src, filename, lineno).tokenize(**kw) end
对 Ruby 程序进行分词,并返回一个字符串数组。filename 和 lineno 参数基本上被忽略,因为返回值只是分词后的输入。默认情况下,此方法不处理 src 中的语法错误,使用 raise_errors 关键字为 src 中的错误引发 SyntaxError。
p Ripper.tokenize("def m(a) nil end") # => ["def", " ", "m", "(", "a", ")", " ", "nil", " ", "end"]
私有实例方法
Source
# File ext/ripper/lib/ripper/core.rb, line 63 def compile_error(msg) end
当解析器发现语法错误时调用此方法。
Source
# File ext/ripper/lib/ripper/core.rb, line 54 def warn(fmt, *args) end
当解析器产生弱警告时调用此方法。fmt 和 args 是 printf 风格的。
Source
# File ext/ripper/lib/ripper/core.rb, line 59 def warning(fmt, *args) end
当解析器产生强警告时调用此方法。fmt 和 args 是 printf 风格的。