python Tf.keras.Model类〜自变量性能

Corentin Limier 2020-01-31 23:48

我创建了一个可复制的示例，但没有遇到任何问题：

import random
import string

import pandas


def gen_random_word(word_length=30):
    return ''.join((random.choice(string.ascii_letters) for _ in range(word_length)))

# I create a list of 300000 labels (but only 150k distinct labels) of 30 characters
labels = [gen_random_word() for _ in range(150000)]
labels = labels + labels
random.shuffle(labels)

# A dataframe here is useless but I try to get close to your own example
df = pandas.DataFrame(
    {'labels': labels}
)

class A:
    def __init__(self):
        self.direct = {}
        self.inverse = {}
        self.progressive = 0

    def fromDataset(self, column):

        # create direct map
        for label in column:
            # skip if present
            if str(label) in self.direct:
                continue
            # else add to direct
            self.direct[str(label)] = self.progressive
            self.inverse[self.progressive] = str(label)
            self.progressive += 1

class B:
    def __init__(self):
        self.direct = {}
        self.inverse = {}
        self.progressive = 0

    def fromDataset(self, column):
        # reset map
        direct = {}
        inverse = {}

        # progressive
        progressive = 0

        # create direct map
        for label in column:
            # skip if present
            if str(label) in direct:
                continue
            # else add to direct
            direct[str(label)] = progressive
            inverse[progressive] = str(label)
            progressive += 1

        self.direct = direct
        self.inverse = inverse
        self.progressive = progressive

第一次测试：

%%time # remove that if you are not using jupyter and use another timing solution

direct = {}
inverse = {}
# progressive
progressive = 0

# create direct map
for label in df['labels']:
    # skip if present
    if str(label) in direct:
        continue
    # else add to direct
    direct[str(label)] = progressive
    inverse[progressive] = str(label)
    progressive += 1

挂墙时间：267毫秒

第二次测试：

%%time
a = A()
a.fromDataset(df['labels'])

挂墙时间：249毫秒

第三次测试：

%%time
b = B()
b.fromDataset(df['labels'])

挂墙时间：220毫秒

所以...没什么大不了的。

Newbie 2020-02-01 00:02:02

您的繁殖是正确的。我已经从类中删除了所有内容（我的意思是其他函数，甚至是anchestor类），现在执行正常。通过测试每个超级类，我在项目中发现了一个继承Tf.keras.Model的类-keras模型是否有可能修改非@tf函数上的内存管理？（当我再次继承它时，行为将变为我所描述的）

Corentin Limier 2020-02-01 00:20:00

当然，tf.keras.Model可以做很多事情来影响内存和执行时间。

Newbie 2020-02-01 00:39:42

如果您对此有所了解，我希望您能更新您的答案，谢谢。

python - Tf.keras.Model类〜自变量性能

相关问题

热门github