从源代码字符串中提取Python函数源文本。

9 浏览2023年7月26日

匿名的 2023年7月26日

0 Comments

假设我有一个有效的Python源代码字符串：

code_string = """
# A comment.
def foo(a, b):
  return a + b
class Bar(object):
  def __init__(self):
    self.my_list = [
        'a',
        'b',
    ]
""".strip()

目标：我想获取包含函数定义源代码的行，同时保留空白。对于上面的代码字符串，我想获取以下字符串：

def foo(a, b):
  return a + b

和

  def __init__(self):
    self.my_list = [
        'a',
        'b',
    ]

或者，同样地，我希望获取代码字符串中函数的行号：foo跨越第2-3行，__init__跨越第5-9行。

尝试：

我可以将代码字符串解析为其AST：

code_ast = ast.parse(code_string)

我可以找到FunctionDef节点，例如：

function_def_nodes = [node for node in ast.walk(code_ast)
                      if isinstance(node, ast.FunctionDef)]

每个FunctionDef节点的lineno属性告诉我们该函数的第一行。我们可以通过以下方法估计该函数的最后一行：

last_line = max(node.lineno for node in ast.walk(function_def_node)
                if hasattr(node, 'lineno'))

但是，当函数以不显示为AST节点的句法元素结尾时，例如__init__中的最后一个]，这种方法并不完美。

我怀疑只使用AST就能找到解决方法，因为在像__init__这样的情况下，AST基本上没有足够的信息。

我不能使用inspect模块，因为它只适用于“活动对象”，而我只有Python代码的字符串形式。我不能使用eval来运行代码，因为那将带来巨大的安全隐患。

理论上，我可以编写一个Python解析器，但那似乎太过复杂了。

在评论中提到的一种启发式方法是使用行的前导空白。然而，这对于具有奇怪缩进的奇怪但有效的函数可能会出错，比如：

def baz():
  return [
1,
  ]
class Baz(object):
  def hello(self, x):
    return self.hello(
x - 1)
def my_type_annotated_function(
  my_long_argument_name: SomeLongArgumentTypeName
) -> SomeLongReturnTypeName:
  # This function's indentation isn't unusual at all.
  pass

Python - 获取调用我的行的源代码

查看 Python 函数的代码

如何获得函数/lambda的准确表示？

我可以将一个文件中选定的Python函数和类方法复制到另一个文件中吗？

如何提取Python文件中一行的精确缩进？

返回函数代码

通过代码对象可以访问内部函数和类吗？

有没有办法从Python解释器中查看函数、类或模块的源代码？

剥离Python字符串

确定一个函数在Python中是从哪个文件定义的

查找字符串中有多少行

Python函数的文本

如何列出特定 .py 文件中的所有类和方法/函数？

解析一个 .py 文件，读取 AST，修改它，然后将修改后的源代码写回。

多行字符串的正确缩进是什么？

脚本以删除Python注释/文档字符串

使用Python删除C和C++的注释？

Python是否有一个内置函数用于去除多行字符串的缩进？

从多个Python文件生成函数调用树

在Python中搜索并获取一行

从源代码字符串中提取Python函数源文本。

0 答案