第16章 AI模型训练 (第2/2页)
现在网上最大的网络小说平台,非点娘不可,他提供的小说类型非常丰富,包括武侠、玄幻、奇幻、仙侠、历史等多种类型。
它是一个付费的网站,在小说的公众期和免费期过了之后,再看它里面的小说,都是需要花费真金白银的。
在用户规模方面,点娘的用户数量庞大无比,其月活跃用户数超过1亿人,点娘中文网的品牌知名度更高,也更受到文学界的认可。
因此,很多知名作家会选择在起点中文网上发表自己的小说。
但是,王卿的心里面也没有底气,虽然说他现在掌握的AI模型非常强大,但是一张3070tI显卡,能训练成什么样子,他也不清楚。
要是到时候拿一部狗屁不通的小说,然后被点娘的编辑给拒稿了。
那丢脸可就丢大发了。
西红柿小说网可就不一样了,它是一个免费网站。
网站的收入,主要来源于投放的广告。
用简单的话来说,就是读者可以通过看广告,来给作者支持。
这里面的学问,可就比较大了。
“我起码有一百种方法,在这西红柿小说网里面,混出一番名堂来。”
“现在,就开始训练模型吧。”
王卿开始着手准备训练自己的写小说AI模型。
为了训练这个模型,他需要一个足够大的小说数据集。
“数据集,自然是在网上获取。”
于是,他开始在各个小说网站上寻找可用的小说数据。
首先被他盯上的,自然是点娘小说网。
他打开了网站首页,看到了里面的分类,点击进去,他发现了分类下有很多小说。
“这个分类下有不知道有多少本小说啊,要是一个个点进去再爬取,肯定会花费很多时间,还是写一个爬虫自动化一下吧!”王卿自言自语道。
于是他开始着手写爬虫,他打开了自己的代码编辑器,开始写起了代码。
他先写了一个简单的爬虫程序,测试是否能够爬取小说的标题和作者。
“先牛刀小试一下。”
信息技术掌握五级,让王卿看到现在的代码,感觉处处都是机会。
但是,未经过实践过,他也不知道自己掌握的东西是不是井中月水中花。
还是要在电脑上跑一跑,心里面才有底。
程序运行了几分钟后,王卿打开了生成的数据文件,看到了里面的内容,没有问题,数万本小说的标题和作者都被写入了数据库之中。